Codificación incorrecta al leer desde Azure Synapse View en la parte superior de los archivos de Parquet

Un usuario Pregunto ✅

Axxeption

Hola,

Tengo una vista en Azure Synapse en la parte superior de mis archivos de parquet, la he creado así:

CREAR VISTA [dbo].[v_tmp] COMO (
SELECCIONE * DESDE
OPENROWSET( A GRANEL ‘https: //***.dfs.core.windows.net/dwh/tmp/*.parquet’, FORMATO=‘PARQUET’)
COMO [result])
Cuando consulto esta vista en Synapse, todo sale como se esperaba.
Pero cuando leo en él Power BI, hay una codificación incorrecta hacia UTF-8. Por ejemplo, «Houzé» se convierte en «Houzà ©».
Ya probé:
  • Para poner la base de datos en Synapse en UTF-8 como se describe aquí.
  • Para transformar la lectura en la columna de datos a UTF-8 usando textEncoding.

¿Hay alguien aquí con otras ideas que podría intentar superar este problema?

¡Muchas gracias!

Axxeption

Después de todo, encontré la solución: de hecho, debería cambiar la intercalación de la base de datos utilizando la consulta a continuación. Pero también necesitaba recrear las vistas en la parte superior. Probablemente algo se almacenó en caché. Ahora tengo los datos codificados correctos en Power BI.

ALTERAR BASE DE DATOS almacén de datos
COTEJAR Latin1_General_100_BIN2_UTF8;
¡Gracias por todo tu aporte!

Axxeption

Después de todo, encontré la solución: de hecho, debería cambiar la intercalación de la base de datos utilizando la consulta a continuación. Pero también necesitaba recrear las vistas en la parte superior. Probablemente algo se almacenó en caché. Ahora tengo los datos codificados correctos en Power BI.

ALTERAR BASE DE DATOS almacén de datos
COTEJAR Latin1_General_100_BIN2_UTF8;
¡Gracias por todo tu aporte!

Hola @Axxeption,

¿Podría intentar obtener datos directamente de ‘https: //***.dfs.core.windows.net/dwh/tmp/*.parquet en lugar de usar la vista desde Azure Synapse?

Si esta publicación ayuda, considere Aceptarla como la solución para ayudar a los demás miembros a encontrarla más rápidamente.

Atentamente,

Dedmon Dai

Axxeption

En respuesta a v-deddai1-msft

¡Gracias por tu respuesta!

De hecho, esto funciona, pero no es lo que quiero porque me gustaría mantener limpio mi Power BI y utilizar los grupos sin servidor a los que conectarme.

lbendlin

¿Qué sucede cuando usa la consulta como su fuente de datos (en lugar de la vista)?

Axxeption

En respuesta a lbendlin

Hola,

Cuando consulto directamente en el archivo de parquet desde powerBI, la codificación es correcta. Entonces, el error debe estar en algún lugar de Synapse.

¿Alguna idea de lo que puedo probar más?

¡Muchas gracias por tu aportación!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *