twister8889
Hola tios,
Estoy intentando mejorar la actualización de datos. Tengo 12 archivos de Excel, que contienen 6 pestañas. Estoy usando datos de transformación para hacer el ETL, una de estas transformaciones tiene más de 30 pasos (no sé si puedo minimizar los pasos)
Aquí tengo algunos ejemplos de mi estructura. (Lo siento por la imagen pero no puedo compartir el modelo de datos)
¿Alguna sugerencia para mejorar la actualización de datos?
– Trate de minimizar los pasos, ¿es suficiente?
– ¿Intenta crear un modelo sin pasos de datos de transformación?
…….
mahoneypat
Su problema de actualización es más probable debido a los 30 pasos y lo que está haciendo allí. Comparta ese código M del Editor avanzado para que podamos proponer enfoques alternativos (tal vez con un paso de búfer si corresponde).
Además, ¿cuántas tablas está cargando en el modelo? Si es múltiple, ¿puede deshabilitar la carga en todos menos uno por separado para ver cuál es el lento?
Palmadita
twister8889
En respuesta a mahoneypat
En primer lugar, gracias por tu respuesta.
Intentaré reproducir el código M aquí, desafortunadamente, no puedo compartir el código. Sin embargo, intentaré minimizar los pasos, no sé si es posible en mi escenario porque tengo muchas transformaciones.
Aquí tengo la fuente de Excel:
https://1drv.ms/f/s!AoDYwrtLrltJn1AmP9R-vWOWRP_w
Cada pestaña, es una tabla en consulta de energía, y después de aplicar la transformación, vinculé las tablas para algunas claves.
selimovd
Hola @ twister8889,
por lo general, Excel y CSV no están hechos para transformaciones tan grandes.
¿Tiene la posibilidad de cargar los archivos en una base de datos relacional? Entonces tiene la ventaja de que el plegado de consultas puede suceder y mejorar mucho.
De lo contrario, piense en cargar XLSX y CSV en un almacenamiento en la nube como Sharepoint, Dropbox o OneDrive y cargue los datos con un flujo de datos:
Introducción a los flujos de datos y la preparación de datos de autoservicio – Power BI | Documentos de Microsoft
Entonces tiene la ventaja de que los datos pueden cargarse un poco más lento en segundo plano. Con su archivo de Power BI Desktop, puede conectarse a las tablas de flujo de datos ya procesadas.
twister8889
En respuesta a selimovd
En primer lugar, gracias por tu respuesta.
– No tengo en este momento para usar la base de datos relacional
– No tengo acceso para usar el flujo de datos.
Teniendo en cuenta este escenario, ¿cree que es posible mejorar el rendimiento y cambiar la estructura (no muchas consultas), excluyendo algunos pasos?