Nettoyer doublons dans une table

Dans une table (par exemple : une table de références avec des codes libellés), j’ai des doublons. J’aimerais pouvoir les supprimer simplement.
Je peux facilement les trouver avec une colonne « DUP » et la formule qui va bien. Puis les supprimer les uns après les autres.
Mais, vu que ma table est grande, j’aimerais savoir s’il y a un moyen plus simple pour supprimer ces doublons.

Pas simple de traiter les doublons en masse sur Grist.
Je viens de penser à une petite astuce pour les repérer tous d’un coup, et donc pouvoir les filtrer et les supprimer tout en même temps.

L’idée est de faire une formule qui affiche un résultat différent pour les valeurs en doubles, (sauf pour la première valeur). On peut faire ça en regardant le nombre de valeurs identiques pour chaque valeur et d’exclure la première valeur.

Avec l’exemple suivant :

La formule de la colonne doublon :
len(Table1.lookupRecords(Nom=$Nom))>1 and min(Table1.lookupRecords(Nom=$Nom).id)!=$id

On regarde donc si on a à la fois :

  • plusieurs fois une même valeur (avec le lookupRecords)
  • l’id de la ligne n’est pas le plus petit id avec la même valeur (seul idée que j’ai trouvée pour isoler une valeur à garder).

Plus qu’à filtrer sur les « true » et supprimer les lignes.

3 « J'aime »

Excellent ! Merci pour l’astuce !

Il y a en fait plus simple que de faire la formule manuellement.
Il suffit d’insérer une colonne, et dans le menu que ça ouvre, on choisi « Détecter les duplicatas dans … ». Puis on sélectionne la colonne qui nous intéresse.
Magie !

bonjour, en effet c’est plus rapide mais on ne garde pas le premier enregistrement . Votre première méthode est mieux car elle permet de garder 1 enregistrement parmi les doublons
Merci