IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Isoler le nom d'une balise [RegEx]


Sujet :

Langage PHP

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    147
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Septembre 2006
    Messages : 147
    Points : 120
    Points
    120
    Par défaut Isoler le nom d'une balise
    Bonjour,

    Je cherche extraire le nom d'une balise avec des Regex, mais voilà, je débute en regex et c'est pas encore totalement limpide.

    Par exemple :
    <p> => p
    <div class="maclasse"> => div
    <a href="..." alt="..."> => a

    J'ai lu plusieurs tutoriaux sur les regex et j'ai un petit début :

    Ça ça devrait me prendre le nom de toutes les balises sans paramètres, mais il ignore mes "<" ">".

    Et après il faut encore spécifier de s'arrêter au premier espace.

    J'ai essayé toutes sortes de variantes mais rien n'y fait, help plz

  2. #2
    Membre éprouvé Avatar de FCYPBA
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    745
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Novembre 2004
    Messages : 745
    Points : 952
    Points
    952
    Par défaut
    Bonjour,

    Tu as un bon début.

    Pour éviter d'avoir une liste de caractères trop important dans ton [], tu peux utiliser les modificateurs pàour rendre ta regex insensible à la casse

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    $regex = '¤<([a-z>]+)>¤i';
    J'utilise ¤ comme délimiteur car c'est un caractère que l'on ne rencontre pas souvent

    Ton expression fonctionne pour toutes les balises sans attributs.

    Pour une balise avec attribut ( <a href= ), il faut que tu prennes tous les caractères alphabétique, ce que tu as fait.
    Mais quand il va rencontre un espace il va s'arrêter, comme ce cas n'est pas prévu, ton pattern ne match pas.

    Pour cela il faut spécifier qu'après la sélection tu acceptes n'importe quel caractère sauf '>' qui ferme la balise

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    $regex = '¤<([a-z>]+)[^>]*>¤i';
    Une version plus courte fonctionne mais est moins "démonstrative"
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    $regex = '¤<([a-z>]+)¤i';
    Ces expressions sont bien évidemment destinés à preg_*

  3. #3
    Membre régulier
    Profil pro
    Inscrit en
    Septembre 2006
    Messages
    147
    Détails du profil
    Informations personnelles :
    Localisation : Suisse

    Informations forums :
    Inscription : Septembre 2006
    Messages : 147
    Points : 120
    Points
    120
    Par défaut
    Alors si j'ai bien compris, c'est le i de fin qui indique qu'il faut être insensible à la casse : |blaBlA|i

    Avec ce que t'a mis :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $regex = '¤<([a-z>]+)[^>]*>¤i';
    [a-z>] : caractères a-z ainsi que la fermeture de la balise '>'
    => mais avec ça si je veut récupérer le nom de la balise il vas mettre un '>' avec non ? ce n'est pas le but...

    Ce qui me donne :
    Qui semble plutôt bien fonctionner

    Merci beaucoup

  4. #4
    Membre éprouvé Avatar de FCYPBA
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    745
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Novembre 2004
    Messages : 745
    Points : 952
    Points
    952
    Par défaut
    [/quote]
    Citation Envoyé par Bloodscalp Voir le message
    Alors si j'ai bien compris, c'est le i de fin qui indique qu'il faut être insensible à la casse : |blaBlA|i
    oui
    Citation Envoyé par Bloodscalp Voir le message
    Avec ce que t'a mis :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $regex = '¤<([a-z>]+)[^>]*>¤i';
    [a-z>] : caractères a-z ainsi que la fermeture de la balise '>'
    Faute de frappe
    Citation Envoyé par Bloodscalp Voir le message
    => mais avec ça si je veut récupérer le nom de la balise il vas mettre un '>' avec non ? ce n'est pas le but...

    Ce qui me donne :
    Qui semble plutôt bien fonctionner
    En effet c'est ce qu'il fallait faire

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XSL] Changer le nom d'une balise et d'un attribut XML
    Par castaka dans le forum XSL/XSLT/XPATH
    Réponses: 2
    Dernier message: 23/10/2008, 19h33
  2. [XSLT] modifier le nom d'une balise
    Par valbrand dans le forum XSL/XSLT/XPATH
    Réponses: 4
    Dernier message: 03/09/2008, 14h27
  3. comment isoler le nom d'une colonne ou d'une table?
    Par Mydriaze dans le forum Requêtes
    Réponses: 2
    Dernier message: 13/07/2007, 16h59
  4. [XSL] Test sur le nom d'une balise
    Par KibitO dans le forum XSL/XSLT/XPATH
    Réponses: 4
    Dernier message: 18/12/2005, 13h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo