Anónimo
Hola a todos,
Tengo una tabla con varias columnas. Una de las columnas es «acción realizada». Cada fila de la columna es una oración. Mi tarea es identificar qué palabras principales de la columna de acciones realizadas se han utilizado con mayor número de palabras.
Estoy usando una nube de palabras para visualizar esto. La nube de palabras me brinda una función adicional para usar palabras vacías que son esenciales para mi tarea. La nube de palabras también me da la flexibilidad de filtrar según las segmentaciones, que también son muy necesarias para mi propósito.
El problema es que solo quiero visualizar palabras que tienen la frecuencia N superior (digamos, 50) en la nube de palabras. No pude encontrar ninguna opción para hacer esto.
¿Alguien puede ayudarme a filtrar las 50 palabras más frecuentes en la columna? La única restricción es que debería poder aplicar segmentaciones y palabras vacías (o cualquier equivalente de palabras vacías).
Intenté copiar la columna como una consulta separada en PowerQuery y convertirla en una lista de palabras, pero eso no ayuda porque no puedo usar las segmentaciones basadas en otras columnas en la nueva nube de palabras.
v-cherch-msft
En respuesta a Anónimo
Hola @Anónimo
Nueva consulta en blanco y pegue la fórmula anterior en el editor avanzado. Luego, puede verificar los pasos en el editor de consultas. Archivo de muestra adjunto.
Saludos,
v-cherch-msft
Hola @Anónimo
Puede usar Dividir, Desvivar columnas y agrupar por función para obtener eso. Por ejemplo:
let Source = Table.FromRows(Json.Document(Binary.Decompress(Binary.FromText("ZY6xDsIwDAV/xcpctRQGBgYkNiQW5qpDSNzKUhOX2OH7SQtDEfvdvdd1pm12bbPftUdTmRsnDECz5ACeJ04gpGADagWOo6BT1JzAeppJHMURcCKtTV/9hq5qnxkXR5MFlOJbB54cKclpxfcb/IJWs5SxB8GL/LqBIgiBE2GUVThshFj4ZAPYYSifytuVnlmWv5/a38i3VcM9M9BIpVABxWem8i6w57Pp+zc=", BinaryEncoding.Base64), Compression.Deflate)), let _t = ((type text) meta [Serialized.Text = true]) in type table [Date = _t, Text = _t]), #"Changed Type" = Table.TransformColumnTypes(Source,{{"Date", type date}, {"Text", type text}}), #"Split Column by Delimiter" = Table.SplitColumn(#"Changed Type", "Text", Splitter.SplitTextByDelimiter(" ", QuoteStyle.Csv), {"Text.1", "Text.2", "Text.3", "Text.4", "Text.5", "Text.6", "Text.7", "Text.8"}), #"Changed Type1" = Table.TransformColumnTypes(#"Split Column by Delimiter",{{"Text.1", type text}, {"Text.2", type text}, {"Text.3", type text}, {"Text.4", type text}, {"Text.5", type text}, {"Text.6", type text}, {"Text.7", type text}, {"Text.8", type text}}), #"Unpivoted Columns" = Table.UnpivotOtherColumns(#"Changed Type1", {"Date"}, "Attribute", "Value"), #"Removed Columns" = Table.RemoveColumns(#"Unpivoted Columns",{"Attribute"}), #"Grouped Rows" = Table.Group(#"Removed Columns", {"Value"}, {{"Count", each Table.RowCount(_), type number}}), #"Sorted Rows" = Table.Sort(#"Grouped Rows",{{"Count", Order.Descending}}), #"Added Index" = Table.AddIndexColumn(#"Sorted Rows", "Rank_TopN", 1, 1) in #"Added Index"
Saludos,
Anónimo
En respuesta a v-cherch-msft
¿Puede cargar un archivo PBIX de muestra donde haya hecho esto?
v-cherch-msft
En respuesta a Anónimo
Hola @Anónimo
Nueva consulta en blanco y pegue la fórmula anterior en el editor avanzado. Luego, puede verificar los pasos en el editor de consultas. Archivo de muestra adjunto.
Saludos,