IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage SQL Discussion :

Insérer des enregistrements sans faire de doublons dans une table


Sujet :

Langage SQL

  1. #1
    Membre actif
    Avatar de katanaenmousse
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    220
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2008
    Messages : 220
    Points : 232
    Points
    232
    Par défaut Insérer des enregistrements sans faire de doublons dans une table
    Bonjour,

    je cherche à faire une commande SQL qui intègre un grand nombre d'enregistrements (>50 000) dans une table (comprenant 3 champs sans faire de doublons. C'est à dire que si les 3 champs de la tables sont strictement identiques, il ne faut pas insérer les données.
    Je précise que les données sont en mémoire dans 3 listes de l'ordinateur.
    Je me pose 2 questions :
    1/ faut t il insérer les données directement une à une dans la table en utilisant quelque chose pour vérifier si l'enregistrement existe déjà avant de l'enregistrer?
    (je ne vois pas trop comment faire cette vérification simplement dans la commande sql)
    2/ faut il plutot enregistrer toutes les données dans une table temporaire et ensuite completer la table avec les nouvelles donnees de la table temporaire?

    quelle solution est la plus correcte et la plus rapide d'après vous? sachant que la 1 je ne vois pas comment faire... :-(

    merci pour votre aide

  2. #2
    Expert éminent sénior
    Homme Profil pro
    Responsable Données
    Inscrit en
    Janvier 2009
    Messages
    5 308
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Responsable Données

    Informations forums :
    Inscription : Janvier 2009
    Messages : 5 308
    Points : 13 059
    Points
    13 059
    Par défaut
    Bonjour,
    JE ne vois que trois solutions:
    1. Dédoublonner les données avant insertion
    2. Tester l'existence des données avant insertion (avec un SELECT)
    3. Définir les 3 colonnes comme clé primaire, et ajouter un IGNORE DUPLICATE dans la requête INSERT.


    Tatayo.

  3. #3
    Membre actif
    Avatar de katanaenmousse
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    220
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2008
    Messages : 220
    Points : 232
    Points
    232
    Par défaut
    merci Tatayo.

    A ton avis laquelle de tes 3 propositions serait la plus rapide a exécuter pour l'utilisateur?

    Je pense que la 3ème solution est intéressante. Je vais essayer de la mettre en oeuvre, si SQLite veut bien accepter IGNORE DUPLICATES.

    Je vais chercher un exemple sur mon moteur de recherche préféré et je vous tien au courant.

    Merci

  4. #4
    Membre éprouvé
    Homme Profil pro
    Chef de projets retraité
    Inscrit en
    Juillet 2011
    Messages
    442
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Cher (Centre)

    Informations professionnelles :
    Activité : Chef de projets retraité
    Secteur : Transports

    Informations forums :
    Inscription : Juillet 2011
    Messages : 442
    Points : 1 159
    Points
    1 159
    Par défaut
    Bonjour,

    Je pense que la 3ème solution est intéressante. Je vais essayer de la mettre en oeuvre, si SQLite veut bien accepter IGNORE DUPLICATES.
    En Sqlite IGNORE DUPLICATES se fait en intégrant une clause IGNORE dans l'ordre d'insertion

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    insert or ignore into matable (colonne) values (MaValeur);
    Cordialement

  5. #5
    Modérateur
    Avatar de escartefigue
    Homme Profil pro
    bourreau
    Inscrit en
    Mars 2010
    Messages
    10 426
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : bourreau
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2010
    Messages : 10 426
    Points : 40 096
    Points
    40 096
    Billets dans le blog
    9
    Par défaut
    Je suppose que la question se pose car il n'y a pas d'index unique sur ces 3 colonnes, car si c'est le cas, le plus simple est de faire l'insert sans controle préalable, puis, si le code SQSL est -803 (clef en double) alors incrémenter un compteur de rejet.
    Et si votre source contient des doublons (d'autant plus possible que 3 listes en entrée) y a -t- il un critère pour déterminer lequel il faut insérer ? car ça peut modifier la solution à mettre en oeuvre

  6. #6
    Membre actif
    Avatar de katanaenmousse
    Profil pro
    Inscrit en
    Octobre 2008
    Messages
    220
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2008
    Messages : 220
    Points : 232
    Points
    232
    Par défaut
    Bonjour,

    alors pour terminer voici la solution que j'ai appliquée en suivant vos conseils (je vous remercie encore )

    je creer un index unique sur les trois colonnes après avoir créé ma table.

    pour cela j'utilise CREATE UNIQUE INDEX

    ensuite j'utilise un INSERT OR IGNORE pour ajouter les enregistrements sans me préocuper de savoir lesquels sont des doublons puisque de toute façon les doublons sont automatiquement ignorés.

    C'est très rapide et ça garanti l'intégrité des données.

    Merci encore à vous tous pour votre aide précieuse.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 2
    Dernier message: 25/05/2009, 10h38
  2. Obtenir la liste des doublons dans une table SAS
    Par marie mouse dans le forum SAS Base
    Réponses: 2
    Dernier message: 05/12/2007, 16h33
  3. Insérer des données d'un tableau php dans une table mysql
    Par tom43 dans le forum SQL Procédural
    Réponses: 4
    Dernier message: 02/08/2006, 10h38
  4. Eliminer des Doublon dans une Table
    Par Soulama dans le forum MS SQL Server
    Réponses: 5
    Dernier message: 03/02/2005, 15h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo