IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Une petite regex à modifier


Sujet :

Langage PHP

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2007
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2007
    Messages : 22
    Points : 16
    Points
    16
    Par défaut Une petite regex à modifier
    Bonjour, dans un code je trouve l'expression régulière suivante :

    Cette expression détecte donc les chaines comprises entre 2 dollars et retourne le contenu avec le dernier dollar inclus. Par contre, je ne comprends pas la signification du égal ?

    Je souhaite cependant modifier cette détection.

    Je veux exclure les dollars précédés d'un anti-slash (\$). C'est à dire que si le dollar est précédé d'un anti-slash, alors il ne doit pas compter comme un dollar normal.

    J'ai du mal à m'en sortir.

    Merci d'avance pour vos idées.

  2. #2
    Membre éclairé Avatar de Korko Fain
    Profil pro
    Étudiant
    Inscrit en
    Août 2005
    Messages
    632
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Août 2005
    Messages : 632
    Points : 718
    Points
    718
    Par défaut
    Le symbole (?=) est ce qu'on appel une assertion c'est à dire qu'il va tester ce qui se trouve apres ton premier dollar et va verifier que ce qui suit (dans le cas du ?=) est bien une suite de nimporte quel caractère suivi d'un $.
    Dans le cas présent il n'a aucun interet.

    Pour la regex que tu veux, tu peux la voir en normale :
    le *? veux simplement dire qu'il doit s'arreter dès que la suite est valide (ici le signe $) sinon il aurait continuer jusqua la fin de ta chaine.
    Exemple simple :
    $toto$ tututurutrut $tata$

    Sans le ?, il t'aurai rétourné toto$ tututurutrut $tata au lieu de toto et tata...
    Tu vois le probleme ? ;=)

    Pour le \s, il va juste verifier que ce qu'il y a entre les $$ ne contient pas d'espace. Car par exemple, dans la chaine précédente, le moteur de regex peut avoir du mal à distinguer $toto$ de $ tutututrutu $. Si tu dois avoir des espaces dans ta chaine entre les $, je pense que c'est pour ça que dans ta premiere regex tu n'avais qu'une seule assertion et non 2 mais je vais trop loin dans les détails là :p

    Et si tu le veux avec des assertions,

  3. #3
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2007
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2007
    Messages : 22
    Points : 16
    Points
    16
    Par défaut
    Merci beaucoup pour les précisions !

    Par contre, en ce qui concerne les espaces, cela ne me pose pas de problème. En fait, ce que je veux c'est que les dollars précédés d'un anti-slash ne soient pas pris en compte et qu'ils soient traités comme un caractère normal.

    Par exemple :

    "$abc$" doit renvoyer "abc$"
    "abc \$ def $ jhi $" doit renvoyer "jhi $" et pas "def $"

  4. #4
    Membre éclairé Avatar de Korko Fain
    Profil pro
    Étudiant
    Inscrit en
    Août 2005
    Messages
    632
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Août 2005
    Messages : 632
    Points : 718
    Points
    718
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    #(?<=(?<!\\)\$)[^\s]*?(?=\$)#
    Toujours sans espaces ^^

  5. #5
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2007
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2007
    Messages : 22
    Points : 16
    Points
    16
    Par défaut
    Merci pour ta réponse.
    J'ai testé l'expression ici et ça me renvoie vrai pour la chaine "$abc\$" alors que ça ne devrait pas car le dernier dollar ne doit pas compter.

    J'ai donc tester cette expression qui semble marcher :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    (?<=(?<!\\)\$).+?(?=(?<!\\)\$)
    J'ai rajouté le "(?<!\\)" à la fin pour que le dollar fermant ne soit pas non plus précédé d'un anti-slash.

    J'ai enlevé le "[^\s]" et remplacé par "." pour qu'il puisse y avoir des espaces.

    J'ai remplacé le "*" par un "+" pour qu'au moins un caractère soit présent entre les deux dollars.

    Si tu peux me confirmer que je me dis pas de bêtises.

    Par contre, le site de test ne permet pas de savoir ce que va retourner la fonction. Et j'avoue avoir du mal à le deviner.
    Merci encore !

  6. #6
    Membre éclairé Avatar de Korko Fain
    Profil pro
    Étudiant
    Inscrit en
    Août 2005
    Messages
    632
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Août 2005
    Messages : 632
    Points : 718
    Points
    718
    Par défaut
    lumadis.be te permettra de tester mieux.
    Oui j'avais pas fait gaffe au $ de fin ^^

    Pour le ., j'avais essayé et ça ne fonctionnait pas avec les assertions, il faudrait mieux utiliser les simples si tu comptes avoir des espaces. Je vais pas rentrer dans les détails du pourquoi ça ne marcherai pas avec les assertions mais en gros c'est pcq les assertions ne concidèrent pas les caractères comme dans la chaine trouvée.

    Ce qui te permet d'utiliser les assertions si tu veux récuperer par exemple :
    !toto!tutu!toto!tatat titi!ptpt!
    les chaines entres !! strictement sans espace. Ce n'est qu'un exemple (sans les assertions il faudrait bidouiller :p)

    Donc je pense que ta regex finale serait plutot
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    #(?<!\\)\$(.+?)(?<!\\)\$#

  7. #7
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2007
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2007
    Messages : 22
    Points : 16
    Points
    16
    Par défaut
    Citation Envoyé par Korko Fain Voir le message
    lumadis.be te permettra de tester mieux.
    Merci pour le lien et pour le reste.
    Je vais utiliser ton site pour continuer à tester ! (bien plus pratique en effet)

  8. #8
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2007
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2007
    Messages : 22
    Points : 16
    Points
    16
    Par défaut
    Dernière question !

    Comment on peut faire pour lui dire que entre les deux dollars, il ne doit pas y avoir d'autre dollar (sauf précédé d'un anti-slash) ?

    Car là il me détecte la chaine "$$$" et me retourne "$$$" alors que ça ne devrait pas en théorie. Par contre "$\$$" devrait bien être détectée.

    En fait ce que l'expression régulière doit faire c'est : détecter des chaines de caractères qui commencent par un $ (et pas un \$), qui se termine par un autre $ (et pas un \$), qui contiennent au moins un caractère (même un espace) entre les deux dollar mais qui ne contiennent pas d'autre dollar (sauf éventuellement des \$).

  9. #9
    Membre éclairé Avatar de Korko Fain
    Profil pro
    Étudiant
    Inscrit en
    Août 2005
    Messages
    632
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Août 2005
    Messages : 632
    Points : 718
    Points
    718
    Par défaut
    Je crois que j'ai reussi mais j'ai du bidouillé. A ce que je sais, ce que tu demande n'est pas possile "simplement" car le "nimporte quel caractère SAUF celui là" se met sous la forme [^Caractère] mais il n'est pas possible de faire simplement "nimporte quel caractère sauf cette chaine là" Donc j'ai du le découper en 2 cas :
    Une chaine suivi d'un \$ (facultatif) ou un \$ (facultatif) suivi d'une chaine.
    A chaque fois la chaine ne contient pas de $.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    #(?<!\\)\$((?:[^$]+(?:\\\$)?)+|(?:(?:\\\$)?[^$]+)+)(?<!\\)\$#
    En décrypté ça donne :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    // Un $ non précédé d'un \
    (?<!\\)\$
    // L'un ou l'autre (on capture)
    (
        // Une chaine qui ne contient pas de $ suivit d'un \$ (facultatif) et ceci un nombre n fois (au moins 1) 
        (?:[^$]+(?:\\\$)?)+
    |
        // Un \$ (facultatif) suivit d'une chaine qui ne contient pas de $ et ceci un nombre n fois (au moins 1)
        (?:(?:\\\$)?[^$]+)+
    )
    // Un $ non précédé d'un \
    (?<!\\)\$

  10. #10
    Membre à l'essai
    Profil pro
    Inscrit en
    Juillet 2007
    Messages
    22
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2007
    Messages : 22
    Points : 16
    Points
    16
    Par défaut
    Merci beaucoup pour ton aide.

    Je ne suis pas certain que ça fonctionne parfaitement mais je vais essayer d'adapter ton code.

    Merci encore !

  11. #11
    Membre éclairé Avatar de Korko Fain
    Profil pro
    Étudiant
    Inscrit en
    Août 2005
    Messages
    632
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Août 2005
    Messages : 632
    Points : 718
    Points
    718
    Par défaut
    Je l'ai testé et il semblerai que cela fonctionne bien mais j'avoue que ce sont des choses assez difficil à faire en regex ^^

Discussions similaires

  1. Un souci d'optimisation avec une "petite" Regex
    Par Sehnsucht dans le forum Général Dotnet
    Réponses: 0
    Dernier message: 17/05/2010, 18h29
  2. [RegEx] Une petite regex qui me bloque !
    Par parampampush dans le forum Langage
    Réponses: 3
    Dernier message: 30/11/2009, 20h54
  3. Une petite question
    Par Etienne1 dans le forum MS SQL Server
    Réponses: 3
    Dernier message: 10/08/2004, 16h19
  4. Réponses: 2
    Dernier message: 23/03/2004, 12h23
  5. Une petite aide pour les API ?
    Par Yop dans le forum Windows
    Réponses: 2
    Dernier message: 04/04/2002, 21h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo