Bonjour,
Ce post fait suite à mon précédent post sur l'extraction d'une chaîne contenant un mot précis ("schtroumpf" dans mes exemples) et va faire plaisir à Stealth qui de façon répétée prône DOM pour parser du xhtml au lieu d'utiliser des regex. (Je lancerai tantôt une discussion sur le thème regex versus DOM).
J'ai besoin — c'est d'ailleurs le point clé de mon projet — de parser à coup sûr des balises du style
Je ne connais pas à l'avance les class autres que schtroumpf appliquées au paragraphe ou au span, ni l'identificateur éventuel, ni les règles de style, ni la présence ou non du commentaire.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 <p (ou span) (éventuellement id="Identificateur") class="class1 class2 schtroumpf class3" (éventuellement style="règles de style")>(éventuellement <span class="Comment">Texte du commentaire</span>) informations concernant la seule class schtroumpf</p> (ou </span>)
Comment concrètement (s'il vous plaît !) procéder pour parser ces balises et récupérer :
1) la balise entière (que je dois remplacer après traitement des informations contenues dans la balise)
2) l'ensemble des class appliquées sous forme de chaîne (je peux avoir besoin de connaître les autres class appliquées en dehors de la class schtroumpf)
3) le texte du commentaire éventuel (que je dois traiter séparément)
4) les informations principales concernant la class schtroumpf, c'est-à-dire le contenu de la balise <p ou span class="xxx schtroumpf xxx"> [...] </p> ou </span>
Un grand, grand merci d'avance
Partager