IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Excel Discussion :

Récupération des lignes en double


Sujet :

Excel

  1. #1
    Membre à l'essai
    Homme Profil pro
    Analyse système
    Inscrit en
    Janvier 2022
    Messages
    101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Analyse système

    Informations forums :
    Inscription : Janvier 2022
    Messages : 101
    Points : 23
    Points
    23
    Par défaut Récupération des lignes en double
    Bonjour,

    Je souhaiterais récupérer les doublons supprimés dans un fichier Excel.
    A priori il n'y a pas de solution standard dans Excel 2021.
    Merci par avance

    Excel 2021/Windows 11

  2. #2
    Membre émérite
    Homme Profil pro
    ingénieur
    Inscrit en
    Mars 2015
    Messages
    1 156
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : ingénieur
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2015
    Messages : 1 156
    Points : 2 745
    Points
    2 745
    Par défaut
    Bonjour

    je ne comprends pas la question
    vous avez supprimé des doublons (via le menu Données/Supprimer des doublons) et vous voulez retrouver ces doublons a posteriori ?

    Stéphane

  3. #3
    Membre à l'essai
    Homme Profil pro
    Analyse système
    Inscrit en
    Janvier 2022
    Messages
    101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Analyse système

    Informations forums :
    Inscription : Janvier 2022
    Messages : 101
    Points : 23
    Points
    23
    Par défaut
    Bonjour,

    Non, j'ai des fichiers avec des doublons et je veux récupérer ces doublons.
    En utilisant la fonction standard d'Excel (rechercher des doublons/supprimer) je constate des doublons.
    Ayant toujours les fichiers d'origine en sauvegarde je peux répéter cette fonction.
    En principe je ne devrais pas avoir de doublons mais il y en a tout de même et je veux les identifier.

    La fonction standard d'Excel ne permet pas de le faire à priori.

    Cdlt

  4. #4
    Membre émérite
    Homme Profil pro
    ingénieur
    Inscrit en
    Mars 2015
    Messages
    1 156
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : ingénieur
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2015
    Messages : 1 156
    Points : 2 745
    Points
    2 745
    Par défaut
    La liste des doublons d'une plage s'obtient avec la formule
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    =UNIQUE(FILTRE(plage;NB.SI(plage;plage)>1))
    Sinon en passant par un tableau croisé dynamique : avec en ligne les clés, en valeur le nombre de clé
    et on filtre les doublons en ajoutant un "filtre s'appliquant aux valeurs", "supérieur à ", 1

    Stéphane

  5. #5
    Membre à l'essai
    Homme Profil pro
    Analyse système
    Inscrit en
    Janvier 2022
    Messages
    101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Analyse système

    Informations forums :
    Inscription : Janvier 2022
    Messages : 101
    Points : 23
    Points
    23
    Par défaut
    Bonjour,

    Mon tableau a 4 colonnes (A à D) et 110507 lignes.
    Voilà ta fonction telle que je l'ai appliquée:

    Code formule : Sélectionner tout - Visualiser dans une fenêtre à part
    =UNIQUE(FILTRE(A1;D110507;NB.SI(A1;D110507)>1))

    J'obtiens le même tableau sans modification (il y a quelques doublons)

    Ai-je bien appliqué ta fonction ?

    Cdlt

  6. #6
    Membre émérite
    Homme Profil pro
    ingénieur
    Inscrit en
    Mars 2015
    Messages
    1 156
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : ingénieur
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2015
    Messages : 1 156
    Points : 2 745
    Points
    2 745
    Par défaut
    Cette formule ne fonctionne que sur une plage d'une seule colonne
    pas avec des doublons sur 4 colonnes

    il faut par exemple ajouter une colonne E avec CONCAT(A2:D2) ou mieux JOINDRE.TEXTE("|";;A2:D2).


    la solution par TCD est possible avec plusieurs colonnes (ajouter toutes les colonnes dans les lignes du TCD, faire un décompte des lignes et filtrer les lignes >1)

    sinon il est préférable de convertir la plage en tableau structuré, c'est une très bonne pratique d'Excel

    Stéphane

  7. #7
    Membre émérite
    Homme Profil pro
    ingénieur
    Inscrit en
    Mars 2015
    Messages
    1 156
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : ingénieur
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2015
    Messages : 1 156
    Points : 2 745
    Points
    2 745
    Par défaut
    Possible avec une formule en concaténant les 4 colonnes dans un EQUIV

    Avec Tab mon tableau

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    =UNIQUE(FILTRE(Tab;
         EQUIV(Tab[Col1]&Tab[Col2]&Tab[Col3]&Tab[Col4];
               Tab[Col1]&Tab[Col2]&Tab[Col3]&Tab[Col4];0)
         <>(LIGNE(Tab)-LIGNE(Tab[#En-têtes]))))

    mais je préfère la solution par TCD illustrée ci-dessous
    Nom : 2022_08_24 doublon 4 colonnes.JPG
Affichages : 166
Taille : 88,9 Ko

    Stéphane

  8. #8
    Membre à l'essai
    Homme Profil pro
    Analyse système
    Inscrit en
    Janvier 2022
    Messages
    101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Analyse système

    Informations forums :
    Inscription : Janvier 2022
    Messages : 101
    Points : 23
    Points
    23
    Par défaut
    Bonjour Stéphane
    Je ne peux utiliser la solution avec concaténation sur une seule colonne.
    En effet ce tableau est une aggrégation de plusieurs tableaux et il existe une colonne supplémentaire en F avec un identifiant correspondant à la personne qui a saisie une partie du tableau.
    Mon objectif est de récupérer les suppressions en double sur les colonnes A à D avec l'identifiant en F afin de connaitre l'origine des doublons.

    J'ai découvert les TCD et après une "formation" accélérée et donc limitée; je suis arrivé à quelques résultats intéressants mais pas à celui que tu as créé.
    Peux-tu me décrire pas à pas ta méthode ?
    En te remerciant encore

  9. #9
    Membre émérite
    Homme Profil pro
    ingénieur
    Inscrit en
    Mars 2015
    Messages
    1 156
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : ingénieur
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2015
    Messages : 1 156
    Points : 2 745
    Points
    2 745
    Par défaut
    Les TCD sont d'une utilité quotidienne et d'une grande puissance.
    il y a de nombreuses vidéos et blogs pour se former sur internet

    voir un exemple pour déterminer les lignes en double
    Nom : Doublon Tableau.gif
Affichages : 165
Taille : 989,6 Ko

    Stéphane

  10. #10
    Membre à l'essai
    Homme Profil pro
    Analyse système
    Inscrit en
    Janvier 2022
    Messages
    101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Analyse système

    Informations forums :
    Inscription : Janvier 2022
    Messages : 101
    Points : 23
    Points
    23
    Par défaut
    Bonsoir,

    C'est parfait.
    J'avais un tableau des doublons très confus que j'ai réglé avec la suppression des sous-totaux.
    Je te remercie sincèrement et vais approfondir mes connaissances pour savoir ce que tu as/j'ai fait car pour l'instant je n'ai pas tout compris!!!
    Cdlt

  11. #11
    Membre expert
    Homme Profil pro
    Formateur et développeur bureautique
    Inscrit en
    Mars 2007
    Messages
    1 527
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Formateur et développeur bureautique
    Secteur : Conseil

    Informations forums :
    Inscription : Mars 2007
    Messages : 1 527
    Points : 3 117
    Points
    3 117
    Par défaut
    Bonjour

    Je me réveille encore un peu tard par rapport à Raccourcix (), mais je peux proposer une solution en (presque) deux clics et zéro formules : en passant par Power Query.

    Procédure succincte :
    depuis votre tableau de départ > Données > A partir d'un tableau ou d'une plage
    Vous arrivez dans l'éditeur PowerQuery
    Sélectionner les colonnes (quatre d'après ce que j'ai compris) sur lesquelles doit porter la recherche de doublon > Conserver les lignes > Conserver les doublons
    Il ne reste plus que les lignes en double (mais elles y sont deux fois chacune au moins)
    Garder sélectionnées les colonnes > Supprimer les lignes > Supprimer les doublons
    Il ne reste qu'une ligne pour chaque doublon
    Fermer et Charger
    Vous revenez dans Excel et dans un nouveau tableau (en vert en général), vous trouvez votre liste.

    S'il y a des changements dans les données de départ et s'il y a besoin de mettre à jour le tableau vert : Données > Actualiser tout


    En espérant que cette autre méthode convienne

    Bon après-midi

    Pierre Dumas

  12. #12
    Membre à l'essai
    Homme Profil pro
    Analyse système
    Inscrit en
    Janvier 2022
    Messages
    101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Analyse système

    Informations forums :
    Inscription : Janvier 2022
    Messages : 101
    Points : 23
    Points
    23
    Par défaut
    Bonjour Pierre,

    Merci pour cette solution plus compréhensible pour un néophyte (la ligne du haut synthétisant la fonction en cours) que le TCD.
    Elle est très rapide et les deux solutions donnent le même résultat .
    En approfondissant les TCD j'ai trouvé quelques tableaux intéressants néanmoins.
    Je pense qu'avec PowerQuery j'arriverai aux mêmes résultats certainement.
    Les labos de Microsoft doivent être en concurrence...

    En tous cas merci à tous les deux pour ces solutions qui me satisfont entièrement.

    Cordialement

    haltero

  13. #13
    Invité
    Invité(e)
    Par défaut
    Bonjour,

    Pour tracker les doublons excel :

    > créer votre "clef d'unicité", qui peut être sur 1 ou plusieurs colonnes
    > faites un tri sur cette clef d'unicité
    > sur une triple colonne faite un système binaire , si la ligne du dessus = la ligne du dessous
    > créer une colonne pour faire une sommation des binaires
    > de cette colonne de sommation, si le résultat = 2 , alors c'est du doublon

    C'est plus clair pour vous ?

  14. #14
    Membre à l'essai
    Homme Profil pro
    Analyse système
    Inscrit en
    Janvier 2022
    Messages
    101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Analyse système

    Informations forums :
    Inscription : Janvier 2022
    Messages : 101
    Points : 23
    Points
    23
    Par défaut
    Bonjour sanderbe,

    Je n'ai rien compris!!
    peux-tu développer STP merci.
    Cdlt

  15. #15
    Invité
    Invité(e)
    Par défaut
    Bonjour,

    Citation Envoyé par haltero2 Voir le message
    Bonjour sanderbe,

    Je n'ai rien compris!!
    peux-tu développer STP merci.
    Cdlt
    Je précise.

    Imagine que tu as une clé d'unicité de ta BDD / liste de data . Cette clef est composée de 1 ou plusieurs champs (identifiant, id, mail, référence, matricule , classification ... ).

    Pour chacune de ces clefs tu as 1 valeur numérique (integer, date , float ... ) .

    Etape 1 :

    Classer chaque clef d'unicité par ordre croissant ou décroissant en fonction de la valeur numérique associée :

    Exemple :

    classement croissant

    toto;vol1;vol2;1
    toto;vol3;vol2;2
    toto2;vol1;vol4;1
    toto2;vol2;vol5;4
    toto2;vol14;vol16;8
    toto3;vol111;vol222;5
    toto3;vol333;vol44;12

    ou bien

    classement décroissant

    toto;vol3;vol2;2
    toto;vol1;vol2;1
    toto2;vol14;vol16;8
    toto2;vol2;vol5;4
    toto2;vol1;vol4;1
    toto3;vol333;vol44;12
    toto3;vol111;vol222;5

    Etape 2 :

    Tu peux maintenant faire une transposée des valeurs (integer, date , float ... ) associées. 1 clef d'unicité , pour X valeurs transposées (nombre de valeurs inconnues à l'avance , à moins de les compter).

    Voici

  16. #16
    Membre à l'essai
    Homme Profil pro
    Analyse système
    Inscrit en
    Janvier 2022
    Messages
    101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Analyse système

    Informations forums :
    Inscription : Janvier 2022
    Messages : 101
    Points : 23
    Points
    23
    Par défaut
    J'ai compris le principe et je te remercie.

    Bonne soirée

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Récupération des lignes non vides
    Par marion.bouilly dans le forum SAS Base
    Réponses: 6
    Dernier message: 09/05/2011, 17h48
  2. extraction des lignes en double ou plus seulement
    Par DEV-10 dans le forum Développement
    Réponses: 6
    Dernier message: 02/12/2010, 16h17
  3. Réponses: 7
    Dernier message: 07/04/2010, 16h59
  4. Supprimer des lignes en double.
    Par Empty_body dans le forum Langage SQL
    Réponses: 3
    Dernier message: 05/06/2007, 15h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo