Calcular similitud de filas/coincidencia aproximada

Hola a todos,

Me gustaría saber si es posible calcular la similitud (basada en filas) entre dos columnas de dos tablas relacionadas. Estoy intentando la coincidencia aproximada, pero el problema aquí es que está mirando la columna completa de la segunda tabla, mientras que necesito verificar la misma fila y, si es posible, agregar un % coincidente. Ya he añadido la relación. En mi ejemplo, tengo una relación basada en ID.

Cuál debería ser mi resultado esperado

IDENTIFICACIÓN	Nombre	(tabla relacionada) ID	(tabla relacionada) Nombre	similitud (basado en el nombre)
1	Pedro	1	Pete	80%

El problema con la coincidencia aproximada es que, aunque puse una relación en el ID, seguirá comprobando toda la columna de nombres en mi segunda tabla. Es por eso que me gustaría saber si es posible hacer esto basado en filas.

2ª tabla:

IDENTIFICACIÓN	Nombre
1	Pete
2	peterp
3	pedros
4	Pete

Gracias por tu tiempo.

Hola @DeBIe,

AFAIk, las fórmulas DAX no son compatibles con la coincidencia parcial. Actualmente, solo admite búsquedas aproximadas basadas en funciones de texto)

De SQL a DAX: comparación de cadenas

En mi opinión, me gustaría sugerirle que eche un vistazo a las funciones de fusión aproximada de consulta de energía.

Consulta de poder Fuzzy fuzzy

Saludos,

Xiaoxin-sheng

Hola @v-shex-msft,

Gracias por su respuesta. Power Query Fuzzy Merge es exactamente lo que he estado intentando, pero no cumple con mis requisitos como se menciona en mi publicación original. Probablemente una buena característica para el futuro.

Hola @DeBIe,

Quizás pueda intentar anidar el ‘filtro’ en el parámetro de la tabla de funciones ‘fusión difusa’ para hacer un prefiltro antes de que se usen en las funciones.

Además, también puede intentar crear una función personalizada para empaquetar múltiples funciones, luego solo necesita pasar el parámetro para invocar las funciones y obtener elementos de resultado.
Por cierto, la tasa de similitud es difícil de calcular manualmente. (normalmente tienen expresiones complejas con comparación matemática con rendimientos deficientes) Quizás pueda considerar calcular los caracteres que existían en ambas cadenas de comparación.

Saludos,

Xiaoxin-sheng

Entradas relacionadas

Deja un comentario Cancelar respuesta