Contar la frecuencia de las palabras en una columna

Un usuario Pregunto ✅

Hola

No pude encontrar una solución para este cálculo. Tengo una columna con títulos de productos como valores. Ahora tengo que contar la frecuencia de las palabras repetidas. Se puede limitar a las 100 palabras repetidas. Cada mes se añaden nuevos títulos de productos con palabras nuevas o existentes. Por lo tanto, la salida tiene que ser dinámica. Los títulos de los productos son todos diferentes. Ejemplo:

título

Buena mala casa perro Uno

un perro malo uno

coche bueno mala buena agua

Asi que en este caso la salida seria:

Bueno 3

malo 3

perro 2

Uno 2

casa 1

coche 1

agua 1

uno 1

¿Cómo puedo contar las palabras más que se producen en una columna?

Ahí @datafield

Descargue este archivo PBIX con una solución de ejemplo.

En Power Query, divida la columna por delimitador (espacio) y elija dividir en filas

wo.png

A continuación, puede agrupar por las palabras y elegir Count como agregación.

Capturaxx.PNG

Ordenar la columna Count es Orden descendente.

saludos

phil

Ahí @datafield

En Power Query, divida la columna por delimitador (espacio) y elija dividir en filas

wo.png

A continuación, puede agrupar por las palabras y elegir Count como agregación.

Capturaxx.PNG

Ordene la columna Cuenta en orden descendente.

saludos

phil

Ahí @datafield

Descargue este archivo PBIX con una solución de ejemplo.

En Power Query, divida la columna por delimitador (espacio) y elija dividir en filas

wo.png

A continuación, puede agrupar por las palabras y elegir Count como agregación.

Capturaxx.PNG

Ordenar la columna Count es Orden descendente.

saludos

phil

En respuesta a Syndicate_Admin

@PhilipTreacy wow, agradezco su esfuerzo por ayudar y la solución que creó, ¡gracias! Esto funcionaría sí. Desafortunadamente, la suma de palabras en los títulos en el futuro estará en un rango de millones. Por lo tanto, la solución con una columna para palabras causaría problemas de rendimiento. Probaré la palabra nube y veré cómo funciona esto. Pero al menos su solución podría ayudar en un futuro caso más pequeño.

Acabo de ver que hay una gran palabra visual de nube. Esto es casi lo que busco:

campo_0-1610570777271.png

Como puedes ver las palabras mas frecuentes. Por ejemplo, «1» ocurre 861 veces. Ahora lo que finalmente necesito es una lista de esta salida en lugar de la nube con una visual de dos columnas / medidas:

PALABRAS? Cantidad

@datafield , Hay una opción para dividir por delimitador (en filas) en power bi, Vea si puede utilizar eso.

https://www.tutorialgateway.org/how-to-split-columns-in-power-bi/

En respuesta a Syndicate_Admin

Hola

La división de la columna de título del producto daría como resultado una división de columnas infinita (ya que los valores de la columna tienen una combinación infinita de palabras).

En pocas palabras, Power BI tiene que hacer una lista con las palabras más frecuentes de una columna. Power BI tiene que buscar por sí mismo qué palabras (las 100 palabras más repetidas estarían bien). ¿Puedes ayudar con esto?

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *