IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langages de programmation Discussion :

Expression Régulière (Balise HTML)


Sujet :

Langages de programmation

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Décembre 2003
    Messages
    138
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2003
    Messages : 138
    Points : 68
    Points
    68
    Par défaut Expression Régulière (Balise HTML)
    Bonjour,

    Je ne sais pas si c'est bien ici que ce genre de sujet a à faire.

    Je n'arrive pas à faire mon expression régulière en fait, bien qu'elle semble "classique"...

    Je souhaite retrouver une DIV spécifique dans un flux html. Ceci avec son contenu bien entendu, et avec sa balise fermante.

    Pour ce faire, j'ai commencé par quelque chose de simple :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <div id="toto">(.*?)</div>
    Cette solution me fait arrêter à la première balise DIV fermante, ce qui me pose évidemment un problème.
    J'ai donc tenté d'intégrer un petit bout d'expression trouvé sur le net qui récupère les balises ouvrantes et fermantes.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <([A-Z][A-Z0-9]*)\b[^>]*>(.*?)</\1>
    cependant, en mélangeant le deux, je n'ai plus aucun match :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <div id="toto">(<([A-Z][A-Z0-9]*)\b[^>]*>(.*?)</\1>)*</div>
    J'imagine qu'il doit y avoir une erreur, mais je ne vois pas trop

    Merci pour votre aide,

  2. #2
    Nouveau membre du Club Avatar de sylvain230
    Homme Profil pro
    Orléans
    Inscrit en
    Mai 2008
    Messages
    234
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France

    Informations professionnelles :
    Activité : Orléans
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2008
    Messages : 234
    Points : 30
    Points
    30
    Par défaut
    Bonjour,

    Essaie de demander dans le forum HTML. Tu auras plus de chance d'avoir une réponse.

    Bonne journée !

  3. #3
    Membre du Club
    Profil pro
    Inscrit en
    Octobre 2007
    Messages
    36
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2007
    Messages : 36
    Points : 54
    Points
    54
    Par défaut
    Si tu es anglophone, un cri du cœur sur le sujet est disponible sur stackoverflow

  4. #4
    Membre régulier
    Homme Profil pro
    Directeur de projet
    Inscrit en
    Juin 2011
    Messages
    44
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations professionnelles :
    Activité : Directeur de projet
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2011
    Messages : 44
    Points : 114
    Points
    114
    Par défaut
    J'ai testé cette expression régulière en Abstrasy:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    (define 's
      (string "<html><body>"
              "<div id=\"toto\">azerty</div>"
              "<div id=\"tati\"><div id=\"toto\">qwerty</div></div>"
              "<p><div    id=\"toto\">dworak</div></p>" 
              "</body></html>"
      )
    )
    
    (display (list-regex "<div[\\s]+id=\"toto\">([^<]*)</div>" in s))
    Le résultat est une liste:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    ["<div id=\"toto\">azerty</div>" "<div id=\"toto\">qwerty</div>" "<div    id=\"toto\">dworak</div>"]
    
    Ready...
    Donc la forme de l'expression ne devrait pas être trop mauvaise.

    Mais, bon... Il ne faut pas oublier que les regex ont leurs limites. Ici, on ne peux pas capturer des séquences dans lesquelles il y aurait des balises.

    Ainsi, '<div id="toto"><b>bold</b></div>' ne sera pas traité correctement.

    Il est peut être préférable d'analyser l'ensemble des balises de manière récursive.

Discussions similaires

  1. Expression régulière lié à une balise html
    Par chris_013 dans le forum JSF
    Réponses: 3
    Dernier message: 28/05/2009, 14h34
  2. [RegEx] Balise HTML dans une expression régulière
    Par isa28 dans le forum Langage
    Réponses: 1
    Dernier message: 09/01/2009, 19h53
  3. expression régulière : balises
    Par tagada_tagada dans le forum Langage
    Réponses: 5
    Dernier message: 04/12/2008, 14h14
  4. [RegEx] Expression régulière et balises html
    Par AMINE_ dans le forum Langage
    Réponses: 5
    Dernier message: 05/01/2008, 11h48
  5. [RegEx] Expression régulières : Balises <SCRIPT>
    Par Gwipi dans le forum Langage
    Réponses: 2
    Dernier message: 24/04/2006, 23h25

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo