Conexión de Power BI Power Query a Azure Data Lake Gen2

Un usuario Pregunto ✅

AndyDDC

Hola,

Estoy cargando datos desde una carpeta de Azure Data Lake Gen2 (10 archivos CSV con un total de alrededor de 5 GB) usando Power Query (comencé en Desktop y ahora lo hago en Dataflows). tengo un Agrupar por transformación que está reduciendo los datos a alrededor de 10 MB después de la agregación. El rendimiento es de alrededor de 15 minutos para cargar los datos y realizar la transformación GroupBy. ¿Alguien puede decirme si Power BI está haciendo todo el trabajo aquí? En el sentido de que Power BI no puede plegar ninguna consulta de transformación al Data Lake (es solo almacenamiento, ¿no?) Y que los datos sin procesar se cargan en el motor de flujo de datos y luego se transforman.

Gracias

Jimmy801

Hola @AndyDDC

seguro que no hay forma de volver a un archivo CSV. Tal vez haya metodologías en las que sería posible plegar, porque otro motor podría cargar el csv en una base de datos y aceptar alguna consulta nativa.

Si esta publicación ayuda o resuelve su problema, márquelo como solución (para ayudar a otros usuarios a encontrar contenido útil y reconocer el trabajo de los usuarios que lo ayudaron)
Los kudoes también son agradables

Divertirse

Palanqueta

Jimmy801

Hola @AndyDDC

seguro que no hay forma de volver a un archivo CSV. Tal vez haya metodologías en las que sería posible plegar, porque otro motor podría cargar el csv en una base de datos y aceptar alguna consulta nativa.

Si esta publicación ayuda o resuelve su problema, márquelo como solución (para ayudar a otros usuarios a encontrar contenido útil y reconocer el trabajo de los usuarios que lo ayudaron)
Los kudoes también son agradables

Divertirse

Palanqueta

AndyDDC

En respuesta a Jimmy801

Gracias Jimmy, eso tiene sentido con los archivos CSV.

¿Qué hay de los archivos Parquet? Me pregunto si pueden plegar parte del procesamiento.

Jimmy801

En respuesta a AndyDDC

Hola @AndyDDC

lo siento, pero nunca escuché acerca de los archivos Parquet. Cuando está cargando desde archivos, siempre es mejor comenzar reduciendo los datos en los primeros pasos, porque esto tiene un impacto en el tiempo de carga. Así que filtrar pasos, eliminar columnas-pasos y luego agrupar los pasos primero

Si esta publicación ayuda o resuelve su problema, márquelo como solución (para ayudar a otros usuarios a encontrar contenido útil y reconocer el trabajo de los usuarios que lo ayudaron)
Los kudoes también son agradables

Divertirse

Palanqueta

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *