bdfox
Estoy desarrollando un tablero usando Apache Hive como almacenamiento de backend (usando un controlador ODBC) y he notado algo extraño.
Cuando agrego una fuente de datos, Power BI ejecuta la consulta 3 veces para cada actualización. Algunas de estas consultas son bastante complejas en grandes conjuntos de datos, con muchas uniones que pueden tardar más de 15 minutos en completarse. Hacer que Power BI ejecute exactamente la misma consulta 3 veces está causando problemas.
¿Qué está haciendo Power BI? ¿Hay alguna forma de conseguir que no ejecute la misma consulta varias veces en cada actualización?
Estoy en Power BI versión 2.47.4766.542 de 64 bits (junio de 2017)
Libertad
El mismo problema aquí. Ejecutando el conector mysql y notando múltiples subprocesos por fuente de datos única. Esto causa grandes problemas de rendimiento, especialmente cuando tiene consultas complejas.
marcelgalema
Yo también veo esto. Creé una API que funciona perfectamente bien en un navegador, pero cuando la llamada se ejecuta como una consulta web, se ejecuta muchas veces. ¡He visto que se ejecutan> 10 consultas antes de que aparezca el cuadro de diálogo de vista previa!
Esto también parece estar relacionado con el tiempo de ejecución de la consulta. Si PBI no obtiene una respuesta, simplemente reintenta la consulta (aproximadamente cada 15 segundos). Pero algunas de mis consultas toman más tiempo que eso y puedes imaginar lo que sucede con mis bases de datos cuando la misma consulta pesada se vuelve a ejecutar todo el tiempo.
Analicé las solicitudes reales y todas son iguales, por lo que no puedo ‘filtrar’ en función de la información de la solicitud. También intenté reescribir la consulta de seleccionar * de la tabla para seleccionar ‘todos los nombres de columna’ de la tabla. Eso es (por supuesto) más rápido, pero no siempre factible (gran número de columnas).
¿Algunas ideas?
Anónimo
¡Hola, equipo de Microsoft!
¿Qué pasa con este tema realmente importante?
No es aceptable que los clientes no tengan ninguna respuesta o solución para este antiguo problema, que es realmente problemático para nosotros ya que varios usuarios ejecutan consultas desde PowerBi Desktop a nuestras fuentes de datos (como Hive) y esto se convierte ahora en un problema de rendimiento real para nuestra plataforma. .
Realmente necesitamos una solución de su equipo. Rápidamente.
BIDrone
En respuesta a Anónimo
Hola,
Tengo el mismo problema con la conexión a Big Query.
Acabo de recibir nuestra factura del mes pasado y he notado que las consultas que he ejecutado a través de Power BI se ejecutan 2 o 3 veces y cada ejecución le está costando al negocio, ya que parece que está diciendo que son nuevas consultas cada vez, por lo que no es así. utilizando los datos almacenados en caché de una ejecución anterior.
¿Alguien ha tenido alguna respuesta sobre por qué está sucediendo esto y, de ser así, alguna recomendación para detenerlo?
Anónimo
En respuesta a BIDrone
¡Hola @BIDrone! Desafortunadamente, no obtuve ninguna respuesta del equipo de Microsoft Power Bi.
Este problema es realmente crítico y está generando costos extra para su empresa y no entiendo por qué no nos están respondiendo.
Se abren varios tickets por el mismo tema pero nadie se mueve …
BIDrone
En respuesta a Anónimo
Hola,
Sé que también estamos recibiendo costos adicionales.
He presentado un boleto a Microsoft a través de nuestro servicio de asistencia técnica, así que, con suerte, si seguimos bombardeándolos, podríamos llegar a alguna parte.
Si escucho algo, te diré si puedes hacer lo mismo.
BIDrone
En respuesta a BIDrone
Hola,
He tenido una conversación por correo electrónico con el equipo de soporte de Power BI y primero dijeron que esto era un error, pero ahora dicen que es por diseño.
Se los he devuelto para explicarles por qué creen que esto es aceptable.
Actualizaré cuando sepa algo
Anónimo
En respuesta a BIDrone
@BIDrone Gracias por toda esa información.
Desde mi punto de vista, no hay respuesta del equipo de Microsoft PowerBI.
BIDrone
En respuesta a Anónimo
Hola,
He tenido numerosas conversaciones por correo electrónico y una llamada real el viernes pasado sobre esto.
En mi caso, estamos usando Big Query y aparentemente, por diseño, PBI ejecutará una consulta dos veces una vez para los metadatos y luego para los datos reales.
Sin embargo, el problema surge cuando usa un controlador ODBC para conectarse (estoy usando Simba como lo recomienda Google), esto luego multiplica la ejecución de una consulta por otras dos veces, por lo que en total al menos 4 veces la consulta se ejecutará, en mi caso ejecuta una consulta hasta 6 veces.
Ejecuté una prueba y la consulta se ejecuta varias veces si realiza modificaciones en la consulta de energía, simplemente abriendo el archivo PBIX. Simplemente configurando el PBIX agregando una columna condicional en PQ aloing con una columna personalizada que se cierra, se vuelve a abrir y se actualiza en total, una consulta simple se ejecutó 22 veces en total … no es bueno.
Hemos retrocedido hasta ahora para solucionarlo, sugirieron usar la API de Big Query, pero el problema es que ejecuta todas las tablas e incluso si configura vistas en Big Query, las trae por etapas, así que de vuelta a múltiples consultas.
Está de vuelta con ellos ahora 😞
ISUGraber
En respuesta a BIDrone
@BIDrone, ¿tienes alguna actualización sobre esto? Nos encontramos con un problema similar, pero el nuestro es con una instancia administrada de Azure.
Anónimo
En respuesta a ISUGraber
Estamos teniendo el mismo problema. Ejecutamos una consulta complicada con múltiples combinaciones. Nos estamos conectando a una base de datos Vertica que se ejecuta en AWS. Nos conectamos a través de ODBC. Ejecutar la consulta varias veces (¡al mismo tiempo!) Significa que la base de datos se queda sin memoria. También nos cuesta dinero innecesariamente.
harredondo
En respuesta a BIDrone
Hola BIDrone, ¿encontraste una manera de evitar esto?
Estoy teniendo el mismo problema importante.
¿Encontraste una manera de solucionar esto?
cbailiss
La ejecución repetida de la misma consulta es un problema que afecta a múltiples fuentes.
Le planteé una idea:
https: //ideas.powerbi.com/forums/265200-power-bi-ideas/suggestions/36713977-stop-executing-queries-m …
Si te sientes fuerte, vota por ello.
Anónimo
¿Es este el comportamiento esperado para cualquier conexión ODBC? También me encuentro con este problema con una base de datos de Redbrick.
sirwinny
Esto es simplemente inaceptable. Esta es la definición de muerte por mil cortes. Tenemos más de 60 paneles distribuidos en 3 servidores y eso todavía no es suficiente para aliviar el problema que esto está creando. Si un tablero está tirando en 5 tablas, eso es 10 conexiones y ejecuciones para tirar de un tablero.
En el ejemplo siguiente, ejecuté un seguimiento en la actualización del tablero y puede ver claramente que la consulta se ejecuta dos veces con un restablecimiento de la conexión en el medio. Es imposible negar el efecto negativo de tantas conexiones incluso a varios servidores.
vncraj
En respuesta a sirwinny
El problema se produce cuando Power BI emite una consulta de Hive similar a ‘SELECT * FROM DATE’, pero si se importa como tabla, solo usa una conexión. Espero que esto ayude
Gracias
Anónimo
Hola,
Esto se debe a que la conexión se establece directamente a su conjunto de datos. Microsoft recomienda crear un modelo tabular, de modo que sus datos se almacenen en el motor olap y arrojen resultados solos a sus informes PBI.
bdfox
En respuesta a Anónimo
No estoy seguro de haberlo entendido completamente. La forma en que estoy extrayendo datos (y apuesto a que los otros en la banda de rodadura lo están haciendo) es conectar a través de ODBC para colmena y ejecutar una importación en una tabla o una consulta que da como resultado un conjunto de datos «tablular». En lo que respecta a Power BI, es el mismo resultado que conectarse a una tabla de Oracle mediante ODBC o cualquier otra base de datos.
¿Es el modelo tabular algo diferente a una salida que se parece a una tabla (columna / filas)?
bullyandrufus
¿Esto ya se ha resuelto? Es junio de 2018 y todavía me está sucediendo usando Hive DB.
bdfox
En respuesta a bullyandrufus
Sigo experimentando el mismo problema con las consultas de Hive utilizando controladores ODBC, tanto en la versión en línea como en la versión de escritorio.