IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

VB.NET Discussion :

Problème de regexp - Comment supprimer les balises HTML


Sujet :

VB.NET

  1. #1
    Membre du Club
    Inscrit en
    Octobre 2005
    Messages
    68
    Détails du profil
    Informations forums :
    Inscription : Octobre 2005
    Messages : 68
    Points : 49
    Points
    49
    Par défaut Problème de regexp - Comment supprimer les balises HTML
    Bonjour

    Celà fais quelques heures que j'esssaye de supprimer les balises HTML d'un texte mais je n'y parviens pas.
    Imaginons, j'ai <html>hello1<body attribut="valeur">hello2</body></html>, le programme doit sortir "hello1" et "hello2".

    J'ai l'expression rationelle qui va bien :
    (?<=^|>)[^><]+?(?=<|$)

    Mais tout ce que je suis arrivé à récupèrer en VB c'est justement les balises sans les hello, ou de remplacer les hello par une autre chaine ou une chaine modifiée comme "texte$1texte" ou $1 correspond à hello1, hello2 ...

    Sauriez vous comme faire ? Car je sèche maitenant ^^

  2. #2
    Expert éminent
    Avatar de StormimOn
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2005
    Messages
    2 593
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Sarthe (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2005
    Messages : 2 593
    Points : 7 660
    Points
    7 660
    Par défaut
    Voici comment faire. C'est du C#, mais le principe est là
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    string input = "<html>hello1<body attribut=\"valeur\">hello2</body></html>";
    string pattern = "(?<=^|>)[^><]+?(?=<|$)";
    MatchCollection matches = Regex.Matches(input, pattern);
    List<string> results = new  List<string>(matches.Count);
    foreach (Match match in matches)
    {
        results.Add(match.Value);
    }

  3. #3
    Membre du Club
    Inscrit en
    Octobre 2005
    Messages
    68
    Détails du profil
    Informations forums :
    Inscription : Octobre 2005
    Messages : 68
    Points : 49
    Points
    49
    Par défaut
    Wouah, merci beaucoup, en effet, ça fonctionne du tonère !
    Je vais regarder comment fonctionne matches et la différence avec les autres fonctions (comme replace, split...) car je n'ai pas tout pigé sur le fonctionnement des regexp ...

  4. #4
    Membre averti Avatar de Sacha999
    Inscrit en
    Mars 2007
    Messages
    294
    Détails du profil
    Informations personnelles :
    Âge : 44

    Informations forums :
    Inscription : Mars 2007
    Messages : 294
    Points : 350
    Points
    350
    Par défaut
    Tu pourrais expliquer la variable pattern, ce que ca veut dire dedans

  5. #5
    Expert éminent
    Avatar de StormimOn
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2005
    Messages
    2 593
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Sarthe (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2005
    Messages : 2 593
    Points : 7 660
    Points
    7 660

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [TinyMCE] Comment supprimer les balises html
    Par Magjjy dans le forum Bibliothèques & Frameworks
    Réponses: 3
    Dernier message: 10/06/2011, 14h57
  2. [PHP 5.2] Comment supprimer les balise php mais pas les html
    Par pierrot10 dans le forum Langage
    Réponses: 1
    Dernier message: 19/05/2009, 23h28
  3. [RegEx] Supprimer les balises HTML
    Par Anduriel dans le forum Langage
    Réponses: 5
    Dernier message: 10/04/2008, 16h51
  4. [PEAR][HTML_QuickForm] Comment supprimer les balises <b> qu'il ajoute par défaut ?
    Par nathieb dans le forum Bibliothèques et frameworks
    Réponses: 1
    Dernier message: 09/05/2007, 16h37
  5. [RegEx] Supprimer les balises HTML
    Par hisy dans le forum Langage
    Réponses: 4
    Dernier message: 19/03/2006, 17h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo