IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Comparer 2 chaines de caractères


Sujet :

Langage Perl

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    21
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 21
    Points : 11
    Points
    11
    Par défaut Comparer 2 chaines de caractères
    Bonjour,

    Je souhaite comparer deux chaines de caractères qui contiennent la source d'une page web. L'une est une référence l'autre est l'état de la page à l'instand t. Le but étant de faire du monitoring en vérifiant que les deux pages se ressemblent beaucoup. (99.9%)

    ex : page de ref : 29254 carac
    et page de mesure 29270 carac

    je ne peux pas utiliser eq car les chaines ne sont pas tout à fait les meme
    (caractère de saut de page, espaces...)
    pourtant les pages contienent exactement le code source.

    Si quelqu'un a un tuyau merci d'avance.

  2. #2
    Membre expert
    Avatar de 2Eurocents
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    2 177
    Détails du profil
    Informations personnelles :
    Âge : 54
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 2 177
    Points : 3 166
    Points
    3 166
    Par défaut
    Bonsoir,

    Sur des chaines relativement courtes, j'aurais tendance à essayer de calculer la distance de Levenshtein entre les deux chaines.

    Pour ce faire, j'utiliserais le module Text::Levenshtein du CPAN.

    Ceci dit, je ne sais pas ce qu'il vaut, et je ne sais pas quelle est la validité de cette méthode sur une longue chaine représentant le contenu d'une page.


    Une autre piste serait de parser le code HTML au moyen d'un parseur "ordinaire", et de jeter un oeil sur la similarité des structures de données qu'il génère vis à vis des deux pages ...

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    21
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 21
    Points : 11
    Points
    11
    Par défaut
    hello merci pour ta réponse

    je vais essayer avec le Levenshtein...

    @+

  4. #4
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    21
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 21
    Points : 11
    Points
    11
    Par défaut
    pour info, mes chaines de caractères font 25ko et c'est beaucoup trop gros...

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Comparer deux chaines de caractères
    Par helww dans le forum C++
    Réponses: 10
    Dernier message: 24/04/2007, 11h26
  2. Comparer la chaine de caractère de deux cellules différentes
    Par idir.17 dans le forum Macros et VBA Excel
    Réponses: 11
    Dernier message: 21/03/2007, 14h48
  3. Réponses: 4
    Dernier message: 08/09/2006, 09h41
  4. Comparer deux chaines de caractères dans un if ?
    Par Xplosif² dans le forum C++
    Réponses: 6
    Dernier message: 25/02/2006, 19h21
  5. comparer deux chaines de caractères
    Par peuf23 dans le forum Langage
    Réponses: 3
    Dernier message: 30/01/2006, 14h31

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo