IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

expression régulière : balises


Sujet :

Langage Perl

  1. #1
    Nouveau membre du Club
    Inscrit en
    Novembre 2008
    Messages
    36
    Détails du profil
    Informations forums :
    Inscription : Novembre 2008
    Messages : 36
    Points : 25
    Points
    25
    Par défaut expression régulière : balises
    Bonjour,

    je souhaiterai parser un fichier dans lequel sera réécrit les lignes de cette forme :
    pour être transformé en :
    C'est a dire que les caracteres qui sont avant les balises sont supprimées mais les espaces conservés.
    Quel est la regexp qui permet de faire cela?

    Je n'arrive pas a l'écrire.

    Merci

  2. #2
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Quel est la regexp qui permet de faire cela?
    Je n'arrive pas a l'écrire.
    Tu pourrais déjà nous montrer tes essais

  3. #3
    Nouveau membre du Club
    Inscrit en
    Novembre 2008
    Messages
    36
    Détails du profil
    Informations forums :
    Inscription : Novembre 2008
    Messages : 36
    Points : 25
    Points
    25
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    Tu pourrais déjà nous montrer tes essais
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    #!/usr/bin/perl
    use strict;
     
    my $val = "TTEET <toto>35</toto>";
    my $tmp = $val;
     
    $tmp = s/.*(\s*)<(.*?)>(.*<\/1>\s*)/$1<$2>$3/;
     
    print $tmp;
    Avec la regexp que j'ai écrit,je veux aussi pouvoir parser une ligne de la forme :

  4. #4
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    Tu peux directement faire une substitution de ta variable
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $var =~ s/.*?(\s*<)/$1/;
    ou sinon récupérer la portion d'intérêt
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    if($var =~ /.*?(\s*<.*)$/){
    	print $1."\n";
    }

    Tu sembles vouloir récupérer tous les éléments individuels de ta ligne ... en as-tu réellement besoin ou veux-tu simplement comme déclarer dans le premier message supprimer les caractères précédent les balises qui ne sont pas des espaces .

    Tu sembles également vouloir vérifier que la balise ouvrante est la même que celle fermante ... est-ce nécessaire?

  5. #5
    Membre émérite
    Avatar de Jasmine80
    Femme Profil pro
    Bioinformaticienne
    Inscrit en
    Octobre 2006
    Messages
    3 157
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 44
    Localisation : Royaume-Uni

    Informations professionnelles :
    Activité : Bioinformaticienne
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2006
    Messages : 3 157
    Points : 2 673
    Points
    2 673
    Par défaut
    $tmp = s/.*(\s*)<(.*?)>(.*<\/1>\s*)/$1<$2>$3/;

    Pour ce qui est de ton expression régulière, voici le problème corrigé :
    $tmp =~ s/.*?(\s*)<(.*?)>(.*?<\/\2>\s*)/$1<$2>$3/;

    $tmp =~ s/.*?(\s*)<(.*?)>(.*?<\/\2>\s*)/$1<$2>$3/;
    Dans le premier .*, si tu ne mets pas de point d'interrogation après l'astérisque, celle-ci va englober tous les espaces suivant TTEET et ton (\s*) sera vide.

  6. #6
    Membre expert
    Avatar de s.n.a.f.u
    Homme Profil pro
    Développeur Web
    Inscrit en
    Août 2006
    Messages
    2 760
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Août 2006
    Messages : 2 760
    Points : 3 545
    Points
    3 545
    Par défaut
    Citation Envoyé par Jasmine80 Voir le message
    Dans le premier .*, si tu ne mets pas de point d'interrogation après l'astérisque, celle-ci va englober tous les espaces suivant TTEET et ton (\s*) sera vide.
    C'est vrai, mais il y a une façon pour encore mieux contrôler le quantificateur * que de simplement le qualifier "ungreedy".

    J'applique le plus souvent possible une technique de ce type :

    Code perl : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    $tmp =~ s/[^\s<]*(\s*)<([^>]*)>([^<]*<\/\2>\s*)/$1<$2>$3/;
    Plutôt que d'utiliser le point générique, je précise expressément les caractères qui ne doivent pas faire partie du matching.
    Je trouve que cela m'induis moins en erreur et, cerise sur le gâteau, cela améliore les performances.

Discussions similaires

  1. Expression Régulière (Balise HTML)
    Par maniaco_jazz dans le forum Langages de programmation
    Réponses: 3
    Dernier message: 07/07/2011, 01h49
  2. [RegEx] expression régulière pour remplacer des balises
    Par oceanbigone dans le forum Langage
    Réponses: 5
    Dernier message: 29/05/2007, 18h11
  3. Réponses: 2
    Dernier message: 27/02/2007, 09h16
  4. [RegEx] balises script et expression régulière
    Par Mr. Smith dans le forum Langage
    Réponses: 2
    Dernier message: 17/01/2007, 16h33
  5. [RegEx] Expression régulières : Balises <SCRIPT>
    Par Gwipi dans le forum Langage
    Réponses: 2
    Dernier message: 24/04/2006, 23h25

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo