IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage SQL Discussion :

tri par corrélation entre chaînes de caractères


Sujet :

Langage SQL

  1. #1
    Membre à l'essai

    Inscrit en
    Juillet 2005
    Messages
    23
    Détails du profil
    Informations forums :
    Inscription : Juillet 2005
    Messages : 23
    Points : 23
    Points
    23
    Par défaut tri par corrélation entre chaînes de caractères
    Bonjour à tous,

    Connaissez vous un moyen de trier des chaînes de caractères par "proximité" ?

    Par exemple j'ai deux chaîne de caractères : "Rest. Truc" et "Truc " ou bien "MAD" et "M A-D", évidemment si je fais un tri par ordre alphabétique, les deux chaînes ne seront pas l'une près de l'autre.

    J'aimerais faire ça pour essayer de supprimer les doublons qu'il peut y avoir dans un fichier clients de 40000 entrées.

    merci

  2. #2
    rsc
    rsc est déconnecté
    Membre éprouvé
    Avatar de rsc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2004
    Messages
    711
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 73
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2004
    Messages : 711
    Points : 918
    Points
    918
    Par défaut Re: tri par corrélation entre chaînes de caractères
    Citation Envoyé par petitmic
    Par exemple j'ai deux chaîne de caractères : "Rest. Truc" et "Truc "
    "Rest.Truc" doit être près de "Rest" ou près de "Truc" ? C'est un peu ça, la difficulté du tri "par proximité". A moins que tu n'explicites tes règles, même un humain a du mal à savoir, alors un ordinateur, je ne te dis pas

    Soit tu sais expliciter ta méthode en un nombre réduit de règles, et tu peux placer ces règles dans la méthode Sort de ta Liste,
    Soit c'est ingérable

    PS : Je m'aperçois que ton Post est dans le forum Langage SQL. Est-ce une erreur ou est-ce que tu veux faire ça en SQL ??

  3. #3
    Membre à l'essai

    Inscrit en
    Juillet 2005
    Messages
    23
    Détails du profil
    Informations forums :
    Inscription : Juillet 2005
    Messages : 23
    Points : 23
    Points
    23
    Par défaut
    salut rsc

    oui c'est pour faire en sql avec Toad.

    Ce que j'aimerais c'est que rest. truc soit près de truc.
    mais c'est sans doute infaisable, j'ai trop de cas différents

  4. #4
    Expert confirmé Avatar de Cybher
    Homme Profil pro
    Consultant réseaux et sécurité
    Inscrit en
    Mai 2005
    Messages
    3 281
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France

    Informations professionnelles :
    Activité : Consultant réseaux et sécurité
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2005
    Messages : 3 281
    Points : 4 644
    Points
    4 644
    Par défaut
    Salut

    Je ne pense pas que ce soit possible.

    en effet coment trierais tu ceci:
    - rest.truc
    - truc
    - truc.a.faire
    - rest.a.faire

    comme ceci:
    - rest.truc
    - truc
    - truc.a.faire
    - rest.a.faire

    ou comme ceci:
    - truc
    - truc.a.faire
    - rest.a.faire
    - rest.truc

    ou bien :
    - truc
    - truc.a.faire
    - rest.truc
    - rest.a.faire

    ...

    Tu vois le problème?

  5. #5
    Membre à l'essai

    Inscrit en
    Juillet 2005
    Messages
    23
    Détails du profil
    Informations forums :
    Inscription : Juillet 2005
    Messages : 23
    Points : 23
    Points
    23
    Par défaut
    oui je vois bien le problème.
    tant pis je chercherais les doublons à la main.

  6. #6
    rsc
    rsc est déconnecté
    Membre éprouvé
    Avatar de rsc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2004
    Messages
    711
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 73
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2004
    Messages : 711
    Points : 918
    Points
    918
    Par défaut
    Je suppose que tu le sais, mais à tout hasard : Tu as tout de même la possibilité de t'aider avec des requêtes LIKE (voire SOUNDEX), qui peuvent sinon trier, du moins de ramener des valeurs "qui ressemblent à"...

  7. #7
    Xo
    Xo est déconnecté
    Expert confirmé
    Avatar de Xo
    Inscrit en
    Janvier 2005
    Messages
    2 701
    Détails du profil
    Informations personnelles :
    Âge : 51

    Informations forums :
    Inscription : Janvier 2005
    Messages : 2 701
    Points : 4 238
    Points
    4 238
    Par défaut Re: tri par corrélation entre chaînes de caractères
    Citation Envoyé par petitmic
    Bonjour à tous,

    Connaissez vous un moyen de trier des chaînes de caractères par "proximité" ?
    Tant qu'on y est, comme tu cherches à traiter des doubons, passe lire l'article de SQLPro à ce sujet : Les doublons : détection et éradication.... Le $4 mentionne les "quasi-doublons" en te donnant un exemple de requête. Toute la difficulté réside dans le choix de ces critères, comme ça a déjà été mentionné ...

  8. #8
    Membre à l'essai

    Inscrit en
    Juillet 2005
    Messages
    23
    Détails du profil
    Informations forums :
    Inscription : Juillet 2005
    Messages : 23
    Points : 23
    Points
    23
    Par défaut
    merci Xo ça va bien m'aidé

Discussions similaires

  1. Similarités entre chaînes de caractères
    Par supaneo dans le forum Général Java
    Réponses: 5
    Dernier message: 04/07/2015, 01h32
  2. Affectation entre chaînes de caractères
    Par saidma dans le forum Débuter avec Java
    Réponses: 4
    Dernier message: 19/10/2014, 23h24
  3. [TPW] Tri de tableau de chaînes de caractères : erreur d'exécution 202
    Par Taieb dans le forum Turbo Pascal
    Réponses: 4
    Dernier message: 10/04/2010, 22h14
  4. Réponses: 3
    Dernier message: 23/08/2007, 09h53
  5. Réponses: 2
    Dernier message: 18/10/2003, 14h42

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo