¿Cómo importar datos de un documento PDF / Word incrustado en el archivo de Excel como fuente para Power BI?

Un usuario Pregunto ✅

Madhumitha_V

Hola a todos,

La fuente de mi informe es una hoja de cálculo de Excel donde, en una de las columnas, tengo un documento PDF / Word incrustado. ¿Cómo puedo importar ese documento PDF / Word como otra fuente en el mismo informe?

¿Hay alguna forma o solución para implementar esto en Power BI?

Columna con documentos PDF y Word incrustados en un archivo de ExcelColumna con documentos PDF y Word incrustados en un archivo de Excel

Comparta sus pensamientos sobre esto.

¡Cualquier sugerencia sobre esto sería de gran ayuda!

Gracias de antemano !!

OwenAuger

Hola @Madhumitha_V,

Sí, usted puede hacer esto. Solo probé un pequeño ejemplo al final.

Puede tratar un archivo .xlsx como un archivo zip que contiene los archivos incrustados.

Los pasos que seguí son:

  1. Utilice una función para «descomprimir» el contenido de su archivo .xlsx. Usé la función publicada aquí:
    http://sql10.blogspot.com/2016/06/reading-zip-files-in-powerquery-m.html
  2. Después de invocar la función anterior, obtiene una tabla que enumera los archivos contenidos en el archivo .xlsx. Los archivos incrustados están debajo xl / incrustaciones.
    Aquí está mi ejemplo, con el archivo .docx como documento de Word y el archivo .bin siendo en realidad un PDF.
    OwenAuger_0-1601299644765.png

  3. A continuación, puede hacer clic en los elementos binarios y transformarlos como lo haría con el contenido binario de un archivo independiente.

Con suerte, puede hacer que esto funcione en su caso. Envíela si es necesario o si desea un ejemplo de PBIX.

Saludos,

Owen

OwenAuger

Hola @Madhumitha_V,

Sí, usted puede hacer esto. Solo probé un pequeño ejemplo al final.

Puede tratar un archivo .xlsx como un archivo zip que contiene los archivos incrustados.

Los pasos que seguí son:

  1. Utilice una función para «descomprimir» el contenido de su archivo .xlsx. Usé la función publicada aquí:
    http://sql10.blogspot.com/2016/06/reading-zip-files-in-powerquery-m.html
  2. Después de invocar la función anterior, obtiene una tabla que enumera los archivos contenidos en el archivo .xlsx. Los archivos incrustados están debajo xl / incrustaciones.
    Aquí está mi ejemplo, con el archivo .docx como documento de Word y el archivo .bin siendo en realidad un PDF.
    OwenAuger_0-1601299644765.png

  3. A continuación, puede hacer clic en los elementos binarios y transformarlos como lo haría con el contenido binario de un archivo independiente.

Con suerte, puede hacer que esto funcione en su caso. Envíela si es necesario o si desea un ejemplo de PBIX.

Saludos,

Owen

Madhumitha_V

En respuesta a OwenAuger

Hola @OwenAuger, Gracias por la solución. También funcionó en mi caso.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *