Eliminar duplicados: recuento de filas

Un usuario Pregunto ✅

Anónimo

Sé cómo eliminar las filas duplicadas en el Editor de consultas. ¿Hay alguna manera de saber cuántos duplicados estaban presentes?

Por ejemplo, en Excel cuando eliminamos duplicados, nos dice «Estas filas duplicadas», ¿verdad? ¿Hay alguna manera de saber ese número en power bi cuando ejecutamos el paso de eliminar duplicados?

¡Gracias por tu ayuda!

ibarrau

En respuesta a PANDAmonio

Puede verificar todas las filas en power query. El top 1000 es solo si el resultado tiene más de 1000. Si ejecuta «Mantener duplicados» primero, puede agregar un paso personalizado como este para verificarlo

= Table.RowCount(#"Keep duplicates")

Espero que esto ayude

tejaswidmello

Hola @Anónimo,

No sé si lo sabes, también hay características maravillosas en power bi, que dan la cuenta de Distinct en una fila.

Editar consultas–> Ver-> Distribución de columnas.

Esto da el recuento distinto en cada fila.

Captura23.PNG

Gracias,

Tejaswi

PANDAmonio

Por lo general, solo cargo los datos y luego creo una medida en el conteo: conteo distinto.

Medida = CONTAR(‘Tabla'[Column1]) – DISTINCTCOUNT(‘Tabla'[Column1])
O para ver el recuento de duplicados usando varias columnas, concatenarlas y crear la misma medida.
Me imagino que dado que el editor de consultas se basa en los 1000 principales, si está utilizando un conjunto de datos grande, no le dará un recuento preciso en Power Query más allá de los 1000 principales. Pero me gustaría si mis suposiciones son correctas, lo que otras personas hacer, y si hay una manera más fácil también.

ibarrau

En respuesta a PANDAmonio

Puede verificar todas las filas en power query. El top 1000 es solo si el resultado tiene más de 1000. Si ejecuta «Mantener duplicados» primero, puede agregar un paso personalizado como este para verificarlo

= Table.RowCount(#"Keep duplicates")

Espero que esto ayude

ibarrau

Hola, si se puede. Primero, seleccione las columnas que desea verificar en busca de duplicados. Luego mantenga duplicados:

mantener duplicadosmantener duplicados

Luego puede agrupar y contar si hay muchas filas.

Una vez que esté seguro de lo que muestran los datos, puede eliminar los duplicados si está seguro.

Otra forma es crear una tabla DAX o conectarse con DAX Studio y escribir una consulta como esta:

EVALUATE
FILTER (
    ADDCOLUMNS (
        SUMMARIZE ( muestradatos, muestradatos[Afiliado] ),
        "CantDuplicados", CALCULATE ( COUNTROWS ( muestradatos ) )
    ),
    [CantDuplicados] > 1
)

Column1 debe ser el campo que desea verificar en busca de duplicados. Puede agregar más columnas o verificar todas. El resultado de esa consulta debería ser qué columnas tienen duplicados y un recuento de ellos.

Espero que esto ayude,

Si esta publicación le ayuda, considere aceptarla como la solución para ayudar a los otros miembros a encontrarla más rápidamente.

Anónimo

Puede hacer un GROUPBY en power query y agregar columnas para el conteo y el conteo distinto.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *