Cómo diseñar y construir conjuntos de datos de una gran cantidad de registros

Un usuario Pregunto ✅

Anónimo

Soy nuevo en Power BI. Disculpe cualquier terminología que no sea coherente con Power BI. Me han puesto a cargo de la creación de cuadros de mando para una gran cantidad de datos. Estoy tratando de determinar cómo diseñar los conjuntos de datos que utilizará Power BI.

Como antecedente, en el siguiente ejemplo, he creado algunas tablas agregadas para usar en los informes de MS SQL. Una lista rápida de tablas agregadas muestra estas tablas, que son equivalentes a los niveles en los informes:

1. Región: categorías adicionales: mes para 6 métricas

2. Mercado – Región – categorías adicionalesMes para 6 métrica

3. Empresa – Mercado – Región – categorías adicionalesMes para 6 métrica

4. Luego, la tabla de contactos y las tablas de hechos

Esto funciona bien en un mundo SQL. ¿Cómo se traducen estos «niveles» en un mundo de Power BI?

Aquí están nuestros datos. Nuestros datos básicos están en 3 tablas de 40 millones, 5 millones y 1 millón. Los registros de hechos contienen información sobre Contactos y tres tipos diferentes de actividades por fecha durante los últimos 36 meses. Nuestros contactos pertenecen a empresas, que se clasifican por mercado y luego por región. La jerarquía es así:

Región – 10

Mercado – 55

Compañía – 6,000

Contactos – 150.000

Por lo general, nuestros usuarios analizan los recuentos de datos mensuales, por región, mercado y empresa. los usuarios quieren interactuar con los paneles para:

1. Compare 6 métricas basadas en recuentos por región.

2. A continuación, acceda a los mercados dentro de cualquier región.

3. Luego compare Compañías, generalmente mostrando las 20 Compañías principales para un mes determinado. Aquí necesitamos un selector o filtro que nos permita elegir un mes y mostrar las 20 principales empresas de ese mes.

4. Luego, los usuarios quieren hacer clic en una empresa y mostrar los contactos de esa empresa para ese mes.

Nota: al darnos cuenta de la cantidad de datos que hay, estamos considerando limitar los paneles a los últimos tres meses solamente. Esto limitaría los hechos a unos 9 millones de registros.

De lo que no estoy seguro es de esto:

– ¿Debo crear un conjunto de datos para la región y el mercado, y luego uno para cada mercado y las empresas en cada mercado?

– ¿Y cómo manejo los datos de la empresa / contacto?

O, en general, ¿cómo determinan otros a partir de grandes conjuntos de datos, a qué niveles, como región, mercado, empresa, para construir conjuntos de datos?

Gracias por cualquier consejo

Esta publicación está destinada a darme el punto de partida para trazar los conjuntos de datos que necesito construir.

Hola @Anónimo

1. Compare 6 métricas basadas en recuentos por región.

No entiendo que «Comparar 6 métricas «significa, por favor, dame un ejemplo.

los recuentos por región se pueden lograr mediante una medida

counts by region = CALCULATE(COUNT('fact'[contacts]),ALLEXCEPT(contact,contact[region]))

Antes de crear una relación entre la tabla «contacto» y «hecho» según la columna «contacto»

1.png

2. A continuación, acceda a los mercados dentro de cualquier región.

Agregar «Columnas Región «,» Mercado «,» Compañía «en el campo de fila de la matriz visual, la medida en el campo de valor.

measure->

count change with hierarchy = COUNT('fact'[contacts])

2.png

Luego, profundice desde el nivel de «región» hasta el nivel de «mercado».

referencia:

Uso de la exploración en profundidad con el objeto visual de Matrix

Modo de exploración en una visualización en Power BI

3. Luego compare Compañías, generalmente mostrando las 20 Compañías principales para un mes determinado. Aquí necesitamos un selector o filtro que nos permita elegir un mes y mostrar las 20 principales empresas de ese mes.

Cree una medida de clasificación, luego agregue esta medida al filtro de nivel visual para mostrar elementos cuando el valor es menor o igual que 20.

counts by companies = CALCULATE(COUNT('fact'[contacts]),ALLEXCEPT(contact,contact[companies]))

rank = RANKX(ALLSELECTED(contact),[counts by companies],,DESC,Dense)

3.png

Para mantener otras imágenes en el tablero no afectadas por la segmentación, edite las interacciones como se muestra a continuación.

4.png

Interacciones de visualización en un informe de Power BI

4. Luego, los usuarios quieren hacer clic en una empresa y mostrar los contactos de esa empresa para ese mes.

Según el paso 3, agregue la columna «empresa» a la segmentación y luego agregue [counts by companies] en una tarjeta visual

5.png

Atentamente

Maggie

Hola @Anónimo

1. Compare 6 métricas basadas en recuentos por región.

No entiendo que «Comparar 6 métricas «significa, por favor, dame un ejemplo.

los recuentos por región se pueden lograr mediante una medida

counts by region = CALCULATE(COUNT('fact'[contacts]),ALLEXCEPT(contact,contact[region]))

Antes de crear una relación entre la tabla «contacto» y «hecho» según la columna «contacto»

1.png

2. A continuación, acceda a los mercados dentro de cualquier región.

Agregar «Columnas Región «,» Mercado «,» Compañía «en el campo de fila de la matriz visual, la medida en el campo de valor.

measure->

count change with hierarchy = COUNT('fact'[contacts])

2.png

Luego, profundice desde el nivel de «región» hasta el nivel de «mercado».

referencia:

Uso de la exploración en profundidad con el objeto visual de Matrix

Modo de exploración en una visualización en Power BI

3. Luego compare Compañías, generalmente mostrando las 20 Compañías principales para un mes determinado. Aquí necesitamos un selector o filtro que nos permita elegir un mes y mostrar las 20 principales empresas de ese mes.

Cree una medida de clasificación, luego agregue esta medida al filtro de nivel visual para mostrar elementos cuando el valor es menor o igual que 20.

counts by companies = CALCULATE(COUNT('fact'[contacts]),ALLEXCEPT(contact,contact[companies]))

rank = RANKX(ALLSELECTED(contact),[counts by companies],,DESC,Dense)

3.png

Para mantener otras imágenes en el tablero no afectadas por la segmentación, edite las interacciones como se muestra a continuación.

4.png

Interacciones de visualización en un informe de Power BI

4. Luego, los usuarios quieren hacer clic en una empresa y mostrar los contactos de esa empresa para ese mes.

Según el paso 3, agregue la columna «empresa» a la segmentación y luego agregue [counts by companies] en una tarjeta visual

5.png

Atentamente

Maggie

Anónimo

En respuesta a v-juanli-msft

Gracias por tu publicación.

Lo que estoy tratando de averiguar es esto:

– ¿Carga los 46 millones de registros de hechos en un pbix? o

– ¿Divido los datos de alguna manera para que los paneles de control se carguen más rápido? ¿Quizás por región por mercado o por mercado por empresa?

En respuesta a Anónimo

Hola @Anónimo

Cuando cargas todo 46 millones de registros de hechos en un pbix, puede ralentizar el rendimiento.

Si necesita todos los datos, después de la importación, puede seguir estos consejos para mejorar el rendimiento.

si solo necesita algunos datos, puede usar el parámetro para conectar la fuente de datos y agregar un parámetro para filtrar los datos.

Para obtener más detalles, lea este artículo.

https://www.red-gate.com/simple-talk/sql/bi/power-bi-introduction-working-with-parameters-in-power-bi-desktop-part-4/

Atentamente

Maggie

Anónimo

Mi pregunta tiene que ver con cómo dividir conjuntos de datos. Mi publicación original puede haber sido complicada, pero estoy buscando consejos sobre cómo abordar la división de mis datos para respaldar nuestras necesidades de paneles.

¿Cómo han abordado otros la división de conjuntos de datos?

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *