cowork16
Estoy tratando de averiguar por qué existen grandes discrepancias en los datos entre Google Analytics y Power BI. Sé que el muestreo puede ser un problema, pero ¿esa es la causa de diferencias tan grandes? Aquí hay parte de una tabla de GA y los mismos datos en PBI. Algunos valores están cerca (por ejemplo, facebook / remarketing) pero otros están completamente desactivados. ¿Algunas ideas? Tengo una fecha límite que cumplir que no será posible si no puedo resolver esto ¡TIA!
v-haibl-msft
@ cowork16
Recibí respuesta del equipo de producto.
Este es el comportamiento esperado. La API que estamos usando para Google Analytics es la que está disponible para los usuarios gratuitos, y se sabe que esa API devuelve valores menos precisos para sitios de gran volumen debido a la forma en que toma muestras de los datos. Desafortunadamente, la API para los clientes de Google Analytics Premium es significativamente diferente a la de los usuarios gratuitos, por lo que necesitaríamos implementar un nuevo conector específicamente para Premium a fin de obtener valores más precisos. Actualmente, esto no está en nuestra hoja de ruta. Los clientes que deseen ver esta función deben solicitarla o votarla (si ya existe) en ideas.powerbi.com.
Atentamente,
Herbert
michaelbilling
Necesita acceder a datos sin procesar / de aciertos no muestreados y hacer las agregaciones usted mismo. Por lo general, es una muy buena idea trabajar con Power BI, ya que es de naturaleza agregada. Al aplicar agregados a una herramienta de agregación, pueden suceder cosas malas con facilidad. Usuarios (incluso analistas profesionales; sí, lo he visto) 🙂 será «seducido» para sumar, promediar, etc., métricas o promedios ya claramente contados, máximos, mínimos, etc.
Necesita una especie de gobernanza de datos y permanecer en la taxonomía de Google Analytics (o salir conscientemente de ella), necesita comprar el caro GA 360 o utilizar los servicios de Google Analytics de Scitylana.
Con estas 2 opciones, puede mover los datos sin procesar a una tabla de BigQuery y a una combinación de DirectQuery e importación en memoria. ¡Esto funciona muy bien!
v-haibl-msft
@ cowork16
Recibí respuesta del equipo de producto.
Este es el comportamiento esperado. La API que estamos usando para Google Analytics es la que está disponible para los usuarios gratuitos, y se sabe que esa API devuelve valores menos precisos para sitios de gran volumen debido a la forma en que toma muestras de los datos. Desafortunadamente, la API para los clientes de Google Analytics Premium es significativamente diferente a la de los usuarios gratuitos, por lo que necesitaríamos implementar un nuevo conector específicamente para Premium a fin de obtener valores más precisos. Actualmente, esto no está en nuestra hoja de ruta. Los clientes que deseen ver esta función deben solicitarla o votarla (si ya existe) en ideas.powerbi.com.
Atentamente,
Herbert
PaulDBrown
En respuesta a v-haibl-msft
@ v-haibl-msft
¿Alguna pista sobre qué umbral define los «sitios de gran volumen»?
¡Gracias!
michaelbilling
En respuesta a PaulDBrown
@PaulDBrown @ v-haibl-msft @ cowork16 @
He pasado mucho tiempo trabajando con GA desde el lado de la API.
Un gran volumen, en este contexto, sería un sitio que cuando se consulta a través de la API, siempre / muy a menudo alcanza el umbral de muestreo de 500.000 visitas dentro del rango de tiempo consultado.
Represento a una empresa que resuelve este desafío con la API estándar. Ven a probarnos.
https://www.scitylana.com
PaulDBrown
En respuesta a michaelbilling
@michaelbilling
Gracias por la aportación. Una pregunta si puedo …
Estoy trabajando en un cliente con una media de 100 mil visitas mensuales (1,2 millones al año). Entonces, si quisiera incluir sus datos de GA en un informe, con tendencias históricas, etc., ¿eso causaría discrepancias en los datos?
Entiendo las implicaciones de los datos agregados y los riesgos que implica su uso en informes. ¿Pero no podemos simplemente replicar datos (evitando volver a agregar en sumas, etc. en PBI) como se ve en GA? Derrota la propuesta de PBI en términos de segmentación, etc., pero por otro lado permite centralizar los informes de diferentes fuentes en PBI para hacer de PBI la única herramienta de informes.
Supongo que lo que encuentro un poco desconcertante es el comentario del póster original de que los datos que se ven en el editor de consultas en PBI son los mismos que se ven en GA, pero ocurren discrepancias en los informes …
(Por cierto, he examinado su producto y suena muy impresionante, aunque no estoy seguro de si este cliente en particular quiere gastar en herramientas adicionales cuando puede acceder a datos en GA de forma gratuita).
Por favor, disculpe mi obvia ignorancia sobre GA, pero nunca antes había necesitado usar datos de GA en PBI. (por cierto, ¿ocurre el mismo problema con los datos extraídos de Facebook, Instagram, etc.?)
Gracias por tu ayuda,
Pablo.
EDITAR: como una ocurrencia tardía, ¿Google Data Studio muestra las mismas discrepancias que podríamos encontrar en PBI?
michaelbilling
En respuesta a PaulDBrown
@PaulDBrown @melany
DataStudio tiene GA integrado de forma nativa.
Todas las consultas se envían al backend de GA y se evalúan.
No hay agregación local. Pero el muestreo todavía entra en acción.
Sí, obtendrá discrepancias históricas.
Cuando cruza el límite de 500K sesiones, lo que sucederá al alcanzar la marca de 5 meses usando su conjunto de datos, se tomará una muestra de todo el conjunto de datos.
¿Qué puedes hacer?
Puede crear un script M que requiera un día de datos a la vez. Construya una tabla unida en, por ejemplo, 365 o tenga muchos días que necesite.
Pero aún estaría limitado por la cantidad de dimensiones de filtro y dimensiones de informes. Fácilmente tendría varios de estos scripts tirando 1 día a la vez. Lo que a su vez será realmente difícil de mantener.
Scitylana
Veo que más y más se topan con este problema. Todos muy confundidos por la cantidad de tiempo que necesitan para invertir en la fuente de datos GA «gratuita». Esta es solo una fuente de datos de muchos de los conjuntos de informes.
Estoy de acuerdo con usted: verificar los datos en GA no está bien, cuando ya se ha dado cuenta de lo difícil que es adoptar empleados / usuarios de cualquier plataforma de informes de BI. La plataforma debería ser el lugar donde los empleados construyan una mejor empresa.
Entiendo que el precio importa.
¿Estás hablando de los conectores de facebook e instagram que se encuentran en www.scitylana.com/connectors?
Tienen los mismos problemas.
PaulDBrown
En respuesta a michaelbilling
@michaelbilling
Gracias por la explicación y advertencia sobre mi escenario particular.
Cuando mencioné otros conectores, me refería a los conectores dentro de Power BI. De su comentario, deduzco que nos encontramos con los mismos problemas al usar los conectores PBI incorporados en ese momento.
¿Los conectores de www.scitylana.com/connectors resuelven los problemas?
Lo que hace que los conectores PBI sean prácticamente inútiles para sitios web / sitios de redes sociales de tráfico medio a grande. ¿A menos que supongo que mantengamos los informes en lo básico y evitemos agregaciones? ¿O el muestreo también tiene un gran impacto? No estoy seguro de cuál es el impacto que tiene realmente el muestreo (disculpas de nuevo, soy nuevo en fuentes como GA, Facebook, Instagram, etc., pero enfrentaré estos problemas en las próximas dos semanas).
Por lo tanto, parece que Power BI no es la herramienta para monitorear la actividad web, a menos que esté preparado para desembolsar una cantidad relevante de €, lo que supongo que está fuera de discusión para la mayoría de las medianas y pequeñas empresas (con alternativas gratuitas disponibles). ).
Por cierto, ¿cómo debo comunicarme con usted o con quien sea para comprender las licencias de Scitylana? He revisado la página y tengo un par de dudas.
Gracias.
michaelbilling
En respuesta a PaulDBrown
@PaulDBrown
Los conectores tienen sus puntos de la semana.
En realidad, esto no es nada nuevo. En mi opinión, sigue siendo preferible el ETL clásico en un DW.
Los conectores Power BI + son BI de nivel de entrada. Pero es realmente genial para configuraciones de BI de nivel de entrada
La actividad web simplemente la lleva al límite más rápido que las otras fuentes de datos. Pero este tipo de fuentes de datos de actividad web se vuelve cada vez más normal. Power BI aumenta las expectativas de las personas más rápido que otros productos.
MS tiene un conjunto completo de productos que puede comprar cuando deje de tener la licencia Pro.
Mis conectores gratuitos tienen los mismos límites.
Pero la solución Google Analytics de Scitylana es sólida con elasticidad incorporada para el crecimiento.
A diferencia de los conectores y el modo de importación de PBI, DirectQuery en Power BI es mucho más relevante de lo que uno pensaría inicialmente.
Creo que una combinación de importación y directa será el futuro. Para equilibrar el costo y el rendimiento.
Eso es bueno para los consultores de BI Analysts. Nuevos tipos de complejidad ven la luz. 🙂
El muestreo es principalmente un problema cuando desea
– integrar fuentes de datos (faltarán las claves de unión)
– calcular las tasas de conversión (la tasa de conversión del 5% podría ser en realidad un 7,5% o un 2,5%)
– profundizar en el comportamiento del usuario
– confiar en los valores reales
Escriba en nuestro chat o envíe un correo electrónico al soporte en scitylana.com
https://www.scitylana.com
melany
En respuesta a PaulDBrown
En mi experiencia, Data Studio refleja con precisión GA. Incluso incorporé un informe de Data Studio en un panel de Power BI como solución alternativa. Pero todavía estamos luchando con la necesidad de consumir algunas piezas de datos de GA con datos de Power BI.
PaulDBrown
En respuesta a melany
@melany
¿Puede compartir cómo se inserta un informe de Data Studio en un panel de POwer Bi (o ayudarme a encontrar los recursos adecuados)?
¡Gracias!
melany
En respuesta a PaulDBrown
@PaulDBrown
Tu simplemente
- utilice Data Studio para conectarse a su cuenta de Google Analytics
- crear el informe en Data Studio
- habilitar la incrustación y copiar el enlace
- abra PowerBI.com y seleccione el panel del espacio de trabajo en el que desea que aparezca el informe
- Agregar mosaico
- Seleccionar contenido web
- Pegar el informe de Data Studio lin
- ¡Ahí tienes!
cowork16
En respuesta a v-haibl-msft
Gracias @ v-haibl-msft, esto tiene sentido. Tendremos que idear un plan B para nuestro informe.
cowork16
¿Alguna ayuda en esto?
v-sihou-msft
En respuesta a cowork16
@ cowork16
Parece un retraso en la recuperación de datos en el conector analítico de Google integrado, puede probar con otros conectores GA de código abierto, como PQGoogleAnalytics
Saludos,
cowork16
En respuesta a v-sihou-msft
Gracias por la respuesta @ v-sihou-msft 🙂 Configuré el conector que mencionaste en tu respuesta y obtengo exactamente los mismos números que con el conector integrado. Pero cuando consulté directamente con PQGoogleAnalytics, los números en el Editor de consultas coincidieron con los números de GA. Así que no sé por qué, cuando pongo los campos en un informe, los números son tan incorrectos.