Inconsistencia en los datos de finalización de objetivos de Google Analytics

Un usuario Pregunto ✅

danxshap

Hola a todos,

Investigué un poco y tengo conocimiento de un par de problemas conocidos con el uso de Google Analytics y Power BI:

  • La API de Google Analytics tomará muestras de datos para sitios de gran volumen, por lo que es posible que los resultados de los sitios de gran volumen no coincidan con la plataforma GA real debido a esto.
  • Ciertas métricas y dimensiones no se pueden combinar o agregar para obtener resultados consistentes.

A menos que me equivoque, no creo que el problema con el que me estoy metiendo esté relacionado con ninguno de esos…

Estoy tratando de obtener datos para responder a la pregunta: Para cada mes, ¿cuántas Finalizaciones del Objetivo 8 obtuvimos para cada grupo de canales?

El Explorador de consultas de Google Analytics, que utiliza la API de informes centrales, me brinda resultados precisos/esperados. Consulte a continuación los datos de los últimos meses y un ejemplo destacado de noviembre de 2020, búsqueda orgánica:

Marcado 2020-12-16 a las 13.33.49.png

Sin embargo, cuando selecciono exactamente las mismas métricas y dimensiones en Power Query (dentro de Power BI Desktop), obtengo resultados incorrectos.

Marcado 2020-12-16 a las 13.34.55.png

¿No deberían ser iguales estos resultados porque ambos se basan en la API de informes centrales?

Finalmente, si filtro por un solo mes (por ejemplo, noviembre de 2020), los valores de la métrica cambian para ser correctos:

Marcado 2020-12-16 a las 13.35.55.png

¿Podría alguien ayudarme a entender por qué agregar un filtro simple como este cambio los valores métricos en otras columnas?:

Table.SelectRows(#"Sorted Rows", each ([Month of Year] = "202011"))

Pensé que la línea Table.SelectRows solo seleccionaría filas que coincidieran con la condición y, por lo tanto, el resultado solo sería que se excluyeran ciertas filas, pero tal vez hay algo que no entiendo sobre cómo funcionan los «cubos». ¿Se está realizando una llamada de API diferente a Google Analytics como resultado de ese filtro?

¡Gracias por cualquier ayuda de antemano!

danxshap

En respuesta a jimmy801

Hola, @Jimmy801, ¡muchas gracias por la respuesta!

Me comuniqué con el soporte de Power BI sobre esto y su respuesta, combinada con la suya, explica lo que está sucediendo.

La solución TLDR es:

  1. Haga que su solicitud funcione en el Explorador de consultas de Google Analytics con los filtros de rango de fechas apropiados y asegúrese de que diga que los datos no están muestreados.
  2. Aplique los mismos filtros de intervalo de fechas a través de un paso de filtro de Power Query y los datos deberían coincidir con el explorador de consultas.

Para cualquier otra persona que se encuentre con este problema, el problema tiene que ver con el filtrado de rango de fechas (o la falta del mismo) con la API de Google Analytics. De forma predeterminada, Power BI no pasa ningún parámetro de filtrado de fechas cuando realiza la solicitud de la API, y eso es lo que da como resultado datos incoherentes; en mis pruebas, en realidad puede ser muestreado datos incluso cuando no está trabajando con grandes números, supongo que porque le está pidiendo a Google Analytics que devuelva datos de años de datos potenciales sin ningún filtro de fecha.

La clave es agregar un paso de filtro en Power Query que limite el rango de fechas, que de alguna manera llega a la solicitud de API resultante (supongo que a través del MDX que mencionó, que es un concepto con el que no estaba familiarizado).

También me pareció muy útil probar la misma solicitud en el Explorador de consultas de Google Analytics para ver cómo los diferentes parámetros de filtrado (a menudo rangos de fechas más grandes) dan como resultado que la herramienta le diga si los datos devueltos se muestrean o no.

jimmy801

Hola @danxshap

intente agregar un Table.Buffer antes de su paso de clasificación. Esto debería solucionar el problema.

Si esta publicación ayuda o resuelve su problema, márquelo como solución (para ayudar a otros usuarios a encontrar contenido útil y reconocer el trabajo de los usuarios que lo ayudaron)
Los saludos también son buenos

Divertirse

Palanqueta

danxshap

En respuesta a jimmy801

Hola @Jimmy801,

¡Gracias por la respuesta! Lo intenté pero no cambió los resultados.

Aquí está el paso intermedio que agregué:

Marcado 2020-12-17 a las 10.22.42.png

Y aquí están los datos resultantes después de ordenarlos para poder ver los últimos meses:

Marcado 2020-12-17 a las 10.23.44.png

Para descartar la posibilidad de que el paso de clasificación esté estropeando los datos de alguna manera, verifiqué la fila de ejemplo incluso sin clasificar y todavía tiene el valor incorrecto:

Marcado 2020-12-17 a las 10.28.21.png

¿Alguna otra idea sobre cómo podría solucionar esto?

¡Gracias!

jimmy801

En respuesta a danxshap

Hola @danxshap

Vi que Power Query está usando funciones de cubo aquí. Lo que significa que en segundo plano se crea un MDX para darle un resultado. Es difícil analizar/comprender por qué en una selección el resultado está bien. Por lo tanto, debe comprender qué está cambiando esta función en la consulta realizada desde Power Query a Google. Tal vez haya algunas agrupaciones. ¿Podría intentar aplicar una agrupación a las dos primeras columnas y aplicar una función de suma a su columna de medida (sin aplicar más Table.Buffer) o escribir un MDX/DAX? por su cuenta

Echa un vistazo a estas posibilidades y hazme saber si esto cambió algo.

Si esta publicación ayuda o resuelve su problema, márquelo como solución (para ayudar a otros usuarios a encontrar contenido útil y reconocer el trabajo de los usuarios que lo ayudaron)
Los saludos también son buenos

Divertirse

Palanqueta

danxshap

En respuesta a jimmy801

Hola, @Jimmy801, ¡muchas gracias por la respuesta!

Me comuniqué con el soporte de Power BI sobre esto y su respuesta, combinada con la suya, explica lo que está sucediendo.

La solución TLDR es:

  1. Haga que su solicitud funcione en el Explorador de consultas de Google Analytics con los filtros de rango de fechas apropiados y asegúrese de que diga que los datos no están muestreados.
  2. Aplique los mismos filtros de rango de fechas a través de un paso de filtro de Power Query y los datos deberían coincidir con el explorador de consultas.

Para cualquier otra persona que se encuentre con este problema, el problema tiene que ver con el filtrado de rango de fechas (o la falta del mismo) con la API de Google Analytics. De forma predeterminada, Power BI no pasa ningún parámetro de filtrado de fechas cuando realiza la solicitud de la API, y eso es lo que da como resultado datos incoherentes; en mis pruebas, en realidad puede ser muestreado datos incluso cuando no está trabajando con grandes números, supongo que porque le está pidiendo a Google Analytics que devuelva datos de años de datos potenciales sin ningún filtro de fecha.

La clave es agregar un paso de filtro en Power Query que limite el rango de fechas, que de alguna manera llega a la solicitud de API resultante (supongo que a través del MDX que mencionó, que es un concepto con el que no estaba familiarizado).

También me pareció muy útil probar la misma solicitud en el Explorador de consultas de Google Analytics para ver cómo los diferentes parámetros de filtrado (a menudo rangos de fechas más grandes) dan como resultado que la herramienta le diga si los datos devueltos se muestrean o no.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *