elockiemofo
Comunidad de Power BI,
¿Cómo lidiar con grandes conjuntos de datos? ¿Siempre utiliza una conexión en vivo a un cubo SSAS o importa los datos?
Estoy al final de mi ingenio. Estoy intentando descubrir la mejor manera de manejar un gran conjunto de datos en Power BI. Tengo un conjunto de datos de aproximadamente 21 millones de filas de datos y alrededor de 40 columnas. Varias de estas columnas son columnas de «valor», como Ventas, COGS, etc. El resto son columnas de dimensión que serán necesarias para crear una de varias porciones de datos. Desafortunadamente, parece que no puedo llegar a un resultado exitoso. Cuando importo estos datos, aumenta el tamaño del archivo a más de 1 GB. Si bien, sorprendentemente, el servicio PBI me permite cargar el archivo .pbix en el servidor (pensé que había un límite de 1 GB), una vez que está allí, el rendimiento del informe es demasiado lento para ser un rendimiento aceptable para un usuario final. No estoy usando dax muy complicado, solo funciones de inteligencia de tiempo «estándar» o simples sumas/restas/divisiones.
Mis datos están sentados en una base de datos de SQL Server. Tengo acceso a una instancia tabular de SSAS. Según la experiencia de la comunidad, ¿es más probable que tenga éxito utilizando una conexión en vivo a un cubo SSAS o importando los datos? Si se trata de importar los datos, ¿cómo puedo optimizar el tamaño del archivo y/o el rendimiento del informe?
Ayuda, eres mi única esperanza…
smpa01
@TheOckieMofo una sugerencia … consulte su tabla (seleccione solo las columnas necesarias) y cree un flujo de datos. ponerlo en horario referesh.
Ahora, para el informe power bi (informe de usuario final), consulte ese flujo de datos. Al menos puede evitar el tiempo de evaluación de la consulta en la actualización del informe.
lorenamschafer
En respuesta a smpa01
@smpa01 Tengo un problema similar con un gran conjunto de datos del que quiero intentar crear tablas de dimensiones, pero está en formato CSV. ¿Hay alguna manera de extraer columnas seleccionadas y valores distintos de esas columnas de un archivo CSV?
smpa01
En respuesta a lorenamschafer
@lorenamschaferExperimenté con un archivo CSV.
La siguiente es la sintaxis
Csv.Document(File.Contents("C:UsersxDesktopcsv.csv"),[Delimiter=",", Columns=2, Encoding=65001, QuoteStyle=QuoteStyle.None])
¿Hay alguna manera de extraer columnas seleccionadas? Sí, puede hacerlo mencionando el número de columnas que desea sobrescribiendo en Columnas = 2. Pero supongo que la selección de columnas funciona de izquierda a derecha y no puede hacer un SQL como SELECCIONAR para elegir sus columnas.
y valores distintos de esas columnas de un archivo CSV? – dado que una declaración SQL no funcionará, dudo que sea posible ejecutar secuencias de comandos adicionales.
Lea para comprender los parámetros permitidos dentro de CSV.Document
https://docs.microsoft.com/en-us/powerquery-m/csv-document
Puede intentar conectarlo a través del conector ODBC y allí puede utilizar completamente las declaraciones SQL
lorenamschafer
En respuesta a smpa01
¡Gracias por una respuesta tan rápida!
Vi los parámetros CSV y para las columnas dice que para las columnas puede usar «una lista de nombres de columnas», pero cuando enumero las columnas tal como están en mi primera fila (ejemplo a continuación), solo las nombra pero no las selecciona esas columnas. Traté de encontrar si había una forma de seleccionar ciertas columnas en CSV, pero no tuve suerte.
Datos de ejemplo:
«InsuredID»,»AccountName»,»PlanName»,»FirstName»,»MiddleInitial»,»LastName»,»IndivTripCostInsured»,»DepartDate»,»ReturnDate»,»CovgBeginDate»,»CovgEndDate»
Código de ejemplo (extrae las dos primeras columnas y nombra la columna respectiva InsuredID y PlanName:
= Csv.Documento(Archivo.Contenido(«Z:DataTravelLegacy DataPremiumAXA_PREM.csv»),[Delimiter=»,», Columns={«InsuredID», «PlanName»}, Encoding=1252, QuoteStyle=QuoteStyle.None])
Código de ejemplo (extrae las dos primeras columnas y nombra la columna respectiva Columna1 y Columna3:
= Csv.Documento(Archivo.Contenido(«Z:DataTravelLegacy DataPremiumAXA_PREM.csv»),[Delimiter=»,», Columns={«Column1», «Column3»}, Encoding=1252, QuoteStyle=QuoteStyle.None])
smpa01
En respuesta a lorenamschafer
@lorenamschafer probó y sí, puedo confirmar el uso de la lista dentro del parámetro de columna
Csv.Document(File.Contents("C:UsersXDesktopcsv.csv"),[Delimiter=",", Columns={"Column1","Column3"}, Encoding=65001, QuoteStyle=QuoteStyle.None])
lorenamschafer
En respuesta a smpa01
Cuando probé ese código, cambió el nombre de las columnas 1 y 2 como «Columna 1» y «Columna 3», respectivamente, en lugar de extraer las columnas 1 y 3. Como mencionó en su primera respuesta, parece tirar de izquierda a derecha en lugar de poder para seleccionar columnas definidas.
marcaCBB
¿No es posible eliminar las dimensiones de la tabla de hechos y crear tablas de dimensiones con identificadores para el hecho?
Tengo un hecho de 80 m de fila y 9 columnas y tiene aproximadamente 0,6 gb
v-yuezhe-msft
@TheOckieMofo,
En primer lugar, Power BI Premium admite cargas de archivos de Power BI Desktop (.pbix) de hasta 10 GB de tamaño. Para más detalles, por favor revise este artículo.
En segundo lugar, si elige el modo de importación, puede seguir la guía de este artículo para optimizar su modelo de datos.
En tercer lugar, si no tiene una licencia premium de Power BI, es mejor que use el modo DirectQuery o Connect Live para conectarse a la fuente de datos, ya que la limitación de 1 GB no se aplica a los conjuntos de datos de directquery. También en este caso, el rendimiento de su informe depende en gran medida del rendimiento de la fuente de datos subyacente.
Saludos,
lidia
Anónimo
En respuesta a v-yuezhe-msft
DirectQuery está limitado a conjuntos de datos < 1 millón de filas. Así que diría que no es bueno para grandes datos. Sin embargo, no veo ninguna limitación en las columnas. Consulte: https://docs.microsoft.com/en-us/power-bi/desktop-use-directquery
La siguiente sugerencia es: Live Connection, he encontrado menos información sobre esto en línea. Actualmente, parece no tener límites. Como todo funciona con SSAS.
https://powerbi.tips/2018/02/power-bi-connections-conexión-en-vivo/