IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Décisions SGBD Discussion :

[Technique] Index, comment font les moteurs de recherche ?


Sujet :

Décisions SGBD

  1. #1
    bat
    bat est déconnecté
    Membre à l'essai
    Inscrit en
    Mai 2002
    Messages
    29
    Détails du profil
    Informations forums :
    Inscription : Mai 2002
    Messages : 29
    Points : 19
    Points
    19
    Par défaut [Technique] Index, comment font les moteurs de recherche ?
    salut à tous,
    est ce que quelqu'un pourrait m'expliquer sur quel principe général fonctionne les moteurs de recherche . En fait ce que je ne comprends pas, c'est que mes requête qui vont chercher quelques milliers de résultats mettent trois heures (un peu moins quand même) alors que google met moins de 2 secondes pour aller chercher des résultats dans des millions (milliards de pages......)....

    Merci d'avance

  2. #2
    Nouveau membre du Club
    Inscrit en
    Avril 2002
    Messages
    23
    Détails du profil
    Informations forums :
    Inscription : Avril 2002
    Messages : 23
    Points : 35
    Points
    35
    Par défaut
    En découpant une page mot par mot en supprimant les mots creux (le, la , les, ...).

    J'utiliserais deux tables pour cela :
    - LIENS : avec CODE, la clé et URL, l'adresse web,
    - MOTS : avec CODE faisant référence à LIENS.CODE et MOT pour stocker un mot.

    Il ne faut pas oublier d'indexer MOTS.MOT sinon c'est cata côté temps réponse.

    Et pour gagner encore un peu de temps, je stockerais tous les mots en majuscule (ou minuscule au choix) sans les accents.

    Maintenant, rien n'indique que google utilise un modèle aussi simple ...

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Août 2002
    Messages
    24
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Août 2002
    Messages : 24
    Points : 21
    Points
    21
    Par défaut
    google comme la plupart des bases de données textuelles, utilisent des INDEX. Bon c'est vrai que c'est très rapide Google.

    Au lieu de chercher dans tout led documents, il se réfère aux INDEX, qui par rapport à un mot et/ou plusieurs, lui donnera les documents concerné.

    Mais comme y pas mal de façons d'indexer et de sélectionner, je vais essayer de trouver une version informatique de mon cours.

  4. #4
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 879
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 879
    Points : 53 057
    Points
    53 057
    Billets dans le blog
    6
    Par défaut
    A lire sur le sujet :

    http://sqlpro.developpez.com/IndxTxt/SQL_IndxTXT.html

    "L'indexation et la recherche sont des points cruciaux des sites Web. Vous allez comprendre et mettre en œuvre certaines techniques utilisées pour l'indexation et la recherche textuelle."

    A +

  5. #5
    Rédacteur/Modérateur

    Avatar de Fabien Celaia
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Octobre 2002
    Messages
    4 224
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 54
    Localisation : Suisse

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : Service public

    Informations forums :
    Inscription : Octobre 2002
    Messages : 4 224
    Points : 19 567
    Points
    19 567
    Billets dans le blog
    25
    Par défaut Indexes
    Il n'y a pas que les indexes du moteur SGBDR, il y a aussi des moteurs de type FULL-Text Search de Verity qui permettent d'indexer de manière beaucoup plus puissante des documents entiers

    Ex: http://manuals.sybase.com/onlinebooks/group-as/asg1250e/verity

Discussions similaires

  1. Réponses: 2
    Dernier message: 22/07/2009, 11h01
  2. Réponses: 1
    Dernier message: 20/09/2007, 11h52
  3. Enlever Les Indexations Dans Les Moteurs De Recherche
    Par RICHARD1232 dans le forum Sécurité
    Réponses: 2
    Dernier message: 26/06/2006, 21h13
  4. Comment référencer mon site dans les moteurs de recherches ?
    Par Viper7 dans le forum Référencement
    Réponses: 9
    Dernier message: 07/06/2006, 23h18

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo