IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Regex et remplacement de PLUSIEURS chaines de caractères dans une même ligne


Sujet :

Langage Perl

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Avril 2009
    Messages
    37
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2009
    Messages : 37
    Points : 12
    Points
    12
    Par défaut Regex et remplacement de PLUSIEURS chaines de caractères dans une même ligne
    Bonjour à tous ,

    J'ai un petit problème étonnant (en tout cas, moi ça m'étonne ) sur un programme que je suis en train d'écrire. Je souhaite remplacer une série de mots dans un fichier, en sortie d'OCRisation imparfaite. J'utilise pour ça du Regex ULTRA basique.

    J'ai créer mon programme et la liste des mots à modifier. Malheureusement, le programme ne corrige que la première erreur rencontrée. Si d'autres mots se trouvent à corriger la première correction, c'est comme s'il ne les voyait pas. Le code ressemble à ça :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
     
    ################
    ### DEBUT    ###
    ################
     
    #!/usr/local/bin/perl
    use POSIX;
    use CGI qw/:all /;
    use UTF8;
     
    my @blocfinal;
     
    $mode = '>';
     
    ######
    # GO #
    ######
     
    open (FICH, "test.txt") || die ("pas de fichier html dans le répertoire\n");
     
    while ($ligne = <FICH>)
    {
    	$ligne =~ s/ viiieis / vineis /;
    	# ici suit une liste interminable de remplacements de ce genre
     
    	push @blocfinal, $ligne;		
    }
     
    close (FICH);
     
    #############################
    # ECRITURE DU FICHIER FINAL #
    #############################
     
    open(OUT, $mode, "out.txt") or die("open: $!");	
     
    	print OUT @blocfinal;	
     
    close (OUT);

    Maintenant si j'applique ça sur un fichier contenant :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    De viiieis sancti petri viiieis ......de cragia, test viiieis test
    J'obtiens :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    De vineis sancti petri viiieis ......de cragia, test viiieis test
    Alors que je voudrais :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    De vineis sancti petri viiieis ......de cragia, test vineis test
    S'il vous plaît, est-ce que quelqu'un aurait une idée pour me sortir de ce mauvais pas ? Je suppose que cela a quelque chose à voir avec ma manière de lire le fichier (while ; $ligne ; etc.). Ou peut-être dans mon RegEx faut-il spécifier quelque part le besoin d'itération ($ligne =~ s/ viiieis / vineis /;
    ) ?

    En vous remerciant pour toute réponse.
    Cordialement.

  2. #2
    Membre régulier Avatar de Tiger-222
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Janvier 2007
    Messages
    76
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Moselle (Lorraine)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Janvier 2007
    Messages : 76
    Points : 106
    Points
    106
    Par défaut
    Bonjour Sancti_Eyes,

    Modifie les lignes de substitution tel que :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $ligne =~ s/ viiieis / vineis /g;
    L'opérateur g veut dire global match, c'est exactement ce que tu recherches (quelques explications ici).

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Avril 2009
    Messages
    37
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2009
    Messages : 37
    Points : 12
    Points
    12
    Par défaut
    Wow, merci Tiger-222 !
    C'est exactement, ce que je cherchais... tout fonctionne maintenant.

    Merci beaucoup et désolé pour la latence de quelques jours
    Cordialement.

  4. #4
    Membre régulier Avatar de Tiger-222
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Janvier 2007
    Messages
    76
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Moselle (Lorraine)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Janvier 2007
    Messages : 76
    Points : 106
    Points
    106
    Par défaut
    Y a pas de quoi

    Pense à mettre [Résolu] dans le titre.

  5. #5
    Membre confirmé
    Avatar de Schmorgluck
    Profil pro
    Inscrit en
    Mai 2006
    Messages
    371
    Détails du profil
    Informations personnelles :
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations forums :
    Inscription : Mai 2006
    Messages : 371
    Points : 558
    Points
    558
    Par défaut
    Autre chose : je suppose que la présences des espaces en débuts et en fins de ta regex et ta chaîne de substitution est destinée à ne traîter que des mots complets, non ? Si c'est cela, n'est pas une bonne façon de faire. Il vaut mieux utiliser le caractère spécial de limite de mot, \b.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $ligne =~ s/\bviiieis\b/\bvineis\b/g;
    Ça évite les problèmes si le mot se trouve à côté d'un signe de ponctuation, par exemple.
    There's nothing like $HOME!

Discussions similaires

  1. [AC-2010] remplacer une chaine de caractère dans une colonne
    Par ambact dans le forum VBA Access
    Réponses: 9
    Dernier message: 09/08/2012, 21h43
  2. Réponses: 2
    Dernier message: 25/09/2011, 01h01
  3. Regex : Recherche chaine de caractère dans une autre chaine de caractère (Unix)
    Par framus.class dans le forum Shell et commandes GNU
    Réponses: 5
    Dernier message: 18/01/2011, 22h05
  4. Réponses: 3
    Dernier message: 06/03/2009, 09h59
  5. Réponses: 2
    Dernier message: 07/03/2007, 10h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo