Alors je vous expose mon problème.
J'ai toujours tendance à penser "bah, ça sera tout simple comme problème", et je change vite d'avis.
Je bosse depuis plusieurs heures sur une regexp qui pourrait me permettre de nettoyer (entendons par là débaliser) une page HTML.
Jusque là, rien de bien méchant :
Avec quelques petites modifications, mais l'idée est là.
Code : Sélectionner tout - Visualiser dans une fenêtre à part s/(<.*?>)/ /g
Maintenant, je veux faire la même chose mais en conservant quelques balises comme le gras et l'italique.
Et pour compliquer le tout, je cherche à ce que l'ordre soit conservé.
J'avais pensé à :
Mais le problème est que toute balise qui contient 'b' ou 'i' (comme <base> par exemple) sera conservée par la même occasion.
Code : Sélectionner tout - Visualiser dans une fenêtre à part s/(<[^bi].*?>)/ /g
Je n'aurais pas demandé votre aide si je n'avais pas passé mon après-midi dessus (entre autres).
Merci d'avance!
Partager