IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

algorithme d'indexation de contacts


Sujet :

Algorithmes et structures de données

  1. #1
    Nouveau membre du Club
    Inscrit en
    Février 2008
    Messages
    51
    Détails du profil
    Informations personnelles :
    Âge : 38

    Informations forums :
    Inscription : Février 2008
    Messages : 51
    Points : 39
    Points
    39
    Par défaut algorithme d'indexation de contacts
    bonsoir,

    j'ai une BD qui contient une liste de contacts que je veux charger en mémoire pour la trier et y faire des traitements d'insertion, recherche (avec partial matching string) et suppression tout en la maintenant triée par ordre alphabétique
    lors de ma recherche j'ai trouvé un certains nombre d'algo tel que HacheTable, Trie, PATRICIA, Judy,Ternary search tree...
    J'aimerais bien que vous m'aider à choisir le bon algorithme en terme de complexité, temps de réponse, charge mémoire et s'il y en a d'autre criètes de choix ils seront les bienvenus!

  2. #2
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 084
    Points
    16 084
    Par défaut
    Il faudrait en savoir un peu plus pour définir une structure de données optimale.

    Pour maintenir un structure triée, les structures de liste chainées sont très pratiques. Pour avoir un accès direct aux éléments, une hashtable est ce qu'il y a de mieux. On peut combiner les deux, soit en favorisant les accès directs(SortedSet/SortedMap, B+Tree, ...).

    Pour les recherches partielles, la table de suffixes est très pratique.

  3. #3
    Expert éminent Avatar de Graffito
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    5 993
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 993
    Points : 7 903
    Points
    7 903
    Par défaut
    Si le nombre de contacts est inférieur à quelques milliers, aucun problème de perfomance en perspective même avec les techniques les moins élaborées (tant qu'on n'enchaîne pas plusieurs centaines de modifications chaque seconde).

  4. #4
    Nouveau membre du Club
    Inscrit en
    Février 2008
    Messages
    51
    Détails du profil
    Informations personnelles :
    Âge : 38

    Informations forums :
    Inscription : Février 2008
    Messages : 51
    Points : 39
    Points
    39
    Par défaut
    en fait je m'explique encore plus,
    mon algo doit être à la fois très performant et permettre la recherche des noms de contact (qui doivent être à leur tour stockés dans une structure de données optimisée) ayant un prefixe commun .
    exemple: lorsque je tape "j" il doit me renvoier les noms qui commence par "j" comme "jean", "jannette",...

  5. #5
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 084
    Points
    16 084
    Par défaut
    Citation Envoyé par tasnim86 Voir le message
    en fait je m'explique encore plus,
    mon algo doit être à la fois très performant et permettre la recherche des noms de contact (qui doivent être à leur tour stockés dans une structure de données optimisée) ayant un prefixe commun .
    exemple: lorsque je tape "j" il doit me renvoier les noms qui commence par "j" comme "jean", "jannette",...
    Si c'est juste une liste indexée est suffisante :
    - Une liste chainée contenant les contacts dans l'ordre alphabétique.
    - Un index des préfixes pointant vers le premier contact possible dans la liste chainée.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
     
    Index1  Index2    Liste
    ---------------------------
                      ...
    I ----> Ir -----> Irène
                      Irina
    J ----> Ja -----> Jacques
                      Jannette
                      Jasmine
            Je -----> Jean
                      Jennifer
    K ----> Ka -----> Kael
                      Karim
            Ke -----> Kerwan
                      Kevin
                      ...

  6. #6
    Nouveau membre du Club
    Inscrit en
    Février 2008
    Messages
    51
    Détails du profil
    Informations personnelles :
    Âge : 38

    Informations forums :
    Inscription : Février 2008
    Messages : 51
    Points : 39
    Points
    39
    Par défaut
    Citation Envoyé par pseudocode Voir le message
    - Un index des préfixes pointant vers le premier contact possible dans la liste chainée.
    merci mais c'est quoi la structure de données de l'index?
    et puis combien d'index dans ce cas?

  7. #7
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 084
    Points
    16 084
    Par défaut
    Citation Envoyé par tasnim86 Voir le message
    merci mais c'est quoi la structure de données de l'index?
    Le plus naturel semble être un arbre des préfixes possibles, ou chaque noeud pointe vers le premier contact de la liste. Si en plus tu maintiens l'ordre lexicographique pour chaque niveau (frère précédant/suivant), ca permet d'optimiser le parcours final de la liste de contact

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
         ______________
        |      |       |
        I      J       K
        |      |       |
        |     _|_     _|_
        |    |   |   |   |
        Ir   Ja  Je  Ka  Ke
    et puis combien d'index dans ce cas?
    Tu peux faire autant de niveau de profondeur que tu veux pour chaque branche. Le mieux étant de créer un nouveau niveau s'il y a trop de contacts pour le préfixe.

  8. #8
    Nouveau membre du Club
    Inscrit en
    Février 2008
    Messages
    51
    Détails du profil
    Informations personnelles :
    Âge : 38

    Informations forums :
    Inscription : Février 2008
    Messages : 51
    Points : 39
    Points
    39
    Par défaut
    une liste chainée pour les contacts et un arbre pour les index, ça ne consomme pas trop de mémoire?
    y a pas une structure qui combine les deux ?

  9. #9
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 084
    Points
    16 084
    Par défaut
    Citation Envoyé par tasnim86 Voir le message
    une liste chainée pour les contacts et un arbre pour les index, ça ne consomme pas trop de mémoire?
    La liste chainée, c'est uniquement pour optimiser les insertions/suppressions. Si ces opérations sont marginales, un tableau (ou plusieurs tableaux) est suffisant.

    Un arbre de préfixes, ca ne coute pas très cher, meme si tu le fais sur 3 ou 4 niveaux.

    y a pas une structure qui combine les deux ?
    Le B+Tree

  10. #10
    Nouveau membre du Club
    Inscrit en
    Février 2008
    Messages
    51
    Détails du profil
    Informations personnelles :
    Âge : 38

    Informations forums :
    Inscription : Février 2008
    Messages : 51
    Points : 39
    Points
    39
    Par défaut
    Citation Envoyé par pseudocode Voir le message
    Un arbre de préfixes, ca ne coute pas très cher, meme si tu le fais sur 3 ou 4 niveaux.
    ]
    et si c'est pour 1000 contacts?

  11. #11
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 084
    Points
    16 084
    Par défaut
    Citation Envoyé par tasnim86 Voir le message
    et si c'est pour 1000 contacts?
    ??

    Bah pour 1000 contacts une simple liste triée avec un index pour la 1ere lettre c'est largement suffisant. Ca fait en moyenne 40 contacts par lettre, une broutille.

  12. #12
    Nouveau membre du Club
    Inscrit en
    Février 2008
    Messages
    51
    Détails du profil
    Informations personnelles :
    Âge : 38

    Informations forums :
    Inscription : Février 2008
    Messages : 51
    Points : 39
    Points
    39
    Par défaut
    Citation Envoyé par pseudocode Voir le message
    Bah pour 1000 contacts une simple liste triée avec un index pour la 1ere lettre c'est largement suffisant. Ca fait en moyenne 40 contacts par lettre, une broutille.
    mais là, comme si tu considére que le prefixe ne peut être que la 1ère lettre du nom donc seulement le 1er caractère

  13. #13
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 084
    Points
    16 084
    Par défaut
    Citation Envoyé par tasnim86 Voir le message
    mais là, comme si tu considére que le prefixe ne peut être que la 1ère lettre du nom donc seulement le 1er caractère
    L'index te donne juste le pointeur de début et le pointeur de fin de la zone de recherche (= tous les contacts qui commencent par la lettre indiquée).

    A chaque fois que tu ajoutes une lettre, il faut avancer le le pointeur de début pour réduire la zone de recherche, en comparant le préfixe du contact avec le préfixe que tu as commencé à taper. C'est assez rapide car tu as peu de contacts à gérer.

  14. #14
    Nouveau membre du Club
    Inscrit en
    Février 2008
    Messages
    51
    Détails du profil
    Informations personnelles :
    Âge : 38

    Informations forums :
    Inscription : Février 2008
    Messages : 51
    Points : 39
    Points
    39
    Par défaut
    Merci pour ton aide,
    mais y a-t-il un tuto qui exlique encore plus la structure de données à utiliser selon ton approche?

  15. #15
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 084
    Points
    16 084
    Par défaut
    Citation Envoyé par tasnim86 Voir le message
    Merci pour ton aide,
    mais y a-t-il un tuto qui exlique encore plus la structure de données à utiliser selon ton approche?
    Pour cette structure particulière, non je ne crois pas.

Discussions similaires

  1. Algorithme de suppression de doublons et d'indexation
    Par hugolapointe dans le forum Algorithmes et structures de données
    Réponses: 5
    Dernier message: 31/10/2011, 19h45
  2. Meilleur algorithme d'indexation?
    Par piasoham dans le forum Algorithmes et structures de données
    Réponses: 11
    Dernier message: 15/02/2010, 16h54
  3. [Oracle Express] Algorithmes d'indexation
    Par isozv dans le forum Débuter
    Réponses: 1
    Dernier message: 14/05/2008, 09h48
  4. Algorithme d'indexation pour moteur de recherche
    Par caspertn dans le forum Algorithmes et structures de données
    Réponses: 7
    Dernier message: 24/04/2006, 16h57
  5. [C / API32 ] Algorithme d'indexation des couleurs
    Par elf dans le forum Algorithmes et structures de données
    Réponses: 6
    Dernier message: 03/08/2005, 03h31

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo