Fusionar y luego agregar lleva mucho más tiempo que fusionar, expandir y luego agrupar por

Un usuario Pregunto ✅

Bombero1017

Hola,

He estado luchando con las tablas de combinación y la función de agregación.

Se necesita mucho tiempo y memoria. A veces, se necesita un archivo que tiene solo unos pocos KB y, al agregarlo, se convierte en un almacenamiento de GB.

Mientras que cuando fusiono, amplío y luego agrupo, sé que los resultados serán exactamente los que espero y se necesitan segundos para ejecutar ambos pasos.

¿Me estoy perdiendo algo o es normal que Power Query esté tan hambriento de recursos cuando se trata de fusionar y agregar?

Gracias

Watkinnc

Hola. El hombre principal, Chris Webb, habla de esto. Digamos que tiene su tabla más pequeña y la anida y la une a su tabla más grande. Después de la combinación, pero ANTES de expandir la columna de la tabla, seleccione la columna en la tabla actual con valores únicos y haga clic con el botón derecho y seleccione «Eliminar duplicados». Luego expanda la columna de su tabla con sus agregaciones. Esto detiene todos los escaneos de tablas innecesarios. ¡Pruébelo! —Nate

Bombero1017

En respuesta a Watkinnc

Hola watkinnc

Gracias por su respuesta.

Leí el blog de Chris Webb y probé todo lo que dice allí y no pude lograr que funcionara como esperaba.

Estoy tratando con relaciones de uno a muchos, donde la tabla lhs solo tiene valores únicos en el campo clave.

¿Ya he dicho que es inaceptable en 2020 tener tales impedimentos en un producto líder en el mercado que puede ser superado por las tablas dinámicas de Excel? ¡Apuesto a que incluso una macro VbA funcionaría mejor! 😋

Entonces, para dejarlo en claro para todos, no estoy buscando una solución alternativa, espero obtener una solución de Microsoft.

Incluso ayudaría con las pruebas si solo pudiera encontrar el tiempo para reconstruir el conjunto de datos que mostraba estos terribles problemas de rendimiento.

¡Pero gracias por pasar! 😎

Hola @ FireFighter1017,

Si desea mejorar el rendimiento, puede probar las sugerencias de @edhans para usar table.buffer, también puede consultar los aspectos de rendimiento de velocidad y mejorar el rendimiento de la agregación después de una fusión en el poder. bi-and-excel-power-query-gettransfor … para más detalles.

Además, si también podría intentar crear una relación y utilizar medidas para ver si puede lograr su objetivo sin fusionarse.

Atentamente,
Zoe Zhi

Si esta publicación ayuda, considere Aceptarla como la solución para ayudar a los demás miembros a encontrarla más rápidamente.

Edhans

Depende de tus datos. He fusionado y agregado millones de registros rápidamente, y veo que tomará una eternidad. Dependiendo de lo que esté haciendo, a veces será útil ajustar un paso antes de la agregación con Table.Buffer (). Nuevamente, depende de los datos y de qué otras transformaciones están haciendo sus consultas.

Bombero1017

En respuesta a Edhans

Se supone que PowerBi es una herramienta de autoservicio.

R o Python pueden hacer un mejor trabajo, en términos de rendimiento, que PowerBI en términos de gestión de datos.

Lo siento EdHans, pero probé tu solución en múltiples ocasiones y, a veces, funciona, y otras veces PowerBI simplemente no es capaz de lidiar con su propia complejidad.

Es una posible solución. Los usuarios no deberían tener que usar funciones no documentadas como Table.Buffer ().

No sé lo que implica, no sé cuáles son las consecuencias de usar esta función. Si Microsoft considera aceptable utilizar esta función antes de agregar tablas fusionadas, entonces debería implementarla como implícita.

En cuanto a agregar claves primarias a las tablas, (respuesta de DAX) no mejoró el rendimiento para mí. En cuanto a la eliminación de duplicados, ya había hecho que el campo de combinación sea único, por lo que tampoco hubo ninguna mejora al hacerlo.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *