IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

 C++ Discussion :

[Regex] match un header XML


Sujet :

C++

  1. #1
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2009
    Messages
    389
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2009
    Messages : 389
    Points : 227
    Points
    227
    Par défaut [Regex] match un header XML
    Bonjour a tous,

    je cherche a match des header XML. Je cherche que des headers de ce type soit reconnue:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    <?xml version="1.0" encoding="UTF-8"?>
    <?xml version="1.0" encoding="UTF-8" ?>
    <?xml version="1.1" ?>
    ....
    J'ai donc cherché une regex que j'ai définie ainsi:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    <\?xml[ ]*version="[1-9]+.[\d]*"[ ]*[\w="\-]*[ ]*\?>
    J'ai l'habitude de faire des regex en Javascript, java, ptyhon, etc. mais c'est la premiere fois en C++ et je ne vois pas pourquoi cette regex ne fonctionne pas.

    voici mon code de test:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
     
    tr1::regex xmlRegex("<\?xml[ ]*version=\"[1-9]+\.[\\d]*\"[ ]*[\\w=\"\-]*[ ]*\?>");
     
    bool isXml=false;
    string line=string("<?xml version=\"1.0\" encoding=\"UTF-8\"?>");
    isXml=tr1::regex_match(line.begin(),line.end(),xmlRegex);
    Ici isXml devrait valoir true, mais il vaut false!!!

    S'auriez vous comment faire cette regex ?

    Je vous remercie d'avance pour votre aide

  2. #2
    Membre éclairé
    Avatar de Ekleog
    Homme Profil pro
    Étudiant
    Inscrit en
    Janvier 2012
    Messages
    448
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Janvier 2012
    Messages : 448
    Points : 879
    Points
    879
    Par défaut
    Sauriez*

    Sinon, ta regex semble mauvaise : en testant avec grep, elle ne renvoie aucun résultat. Es-tu certain de ta syntaxe ? (En particulier [\d] ; je n'ai pas fait de regex depuis un moment mais il me semble que c'est plutôt \d).


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    $ grep -e '<\?xml[ ]*version="[1-9]+.[\d]*"[ ]*[\w="\-]*[ ]*\?>'
    <?xml version="1.0" encoding="UTF-8"?>
    <?xml version="1.0" encoding="UTF-8" ?>
    <?xml version="1.1" ?>
     
    ^C
    On peut remarquer qu'aucun résultat n'est retourné. (et ajouter des \ devant chacun des \ déjà présents dans la regex ne change rien)

    D'où ma suggestion de revoir ta regex.

  3. #3
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2009
    Messages
    389
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2009
    Messages : 389
    Points : 227
    Points
    227
    Par défaut
    ba ecoute non je suis pas sur, j'ai pas de nunux sous la main donc pas de grep pour testé (au taf c'est windows ).
    Par contre, je l'ai testé en temps que regex javascript (http://regexpal.com/) et elle fonctionne.

    EDIT: j'ai formé une autre regex (PCRE, testé avec preg_match --> PHP) mais celle-ci ne fonctionne pas sur mon code C++

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    ^<\?xml( )+version="(\\d)+.(\\d)+"( )*([\\d\\w"\-=]*)( )*\?>$
    Help me

  4. #4
    Rédacteur/Modérateur
    Avatar de JolyLoic
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Août 2004
    Messages
    5 463
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Août 2004
    Messages : 5 463
    Points : 16 213
    Points
    16 213
    Par défaut
    Le caractère "\" a une signification dans le code C++. La preuve, tu l'utilises pour "escaper" les guillements. Et bien, \. ou \? sont aussi considérés comme spéciaux... Pour avoir un '\' dans la regex, tu dois le doubler. Le code suivant match bien, mais je n'ai pas forcément tout bien doublé, n'ayant pas analysé si dans ta regex tu veux par exemple des " ou des \"

    Avec C++11, il sera possible d'écrire ça bien plus simplement, grâce aux raw string literals qui permettront d'entrer une chaîne où les caractères \ ne seront pas interprétés.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    #include <regex>
    #include <string>
    #include <iostream>
     
    using namespace std;
     
    int main()
    {
    	std::string regexText = "<\\?xml[ ]*version=\"[1-9]+\\.[\\d]*\"[ ]*[\\w=\"\\-]*[ ]*\\?>";
     
    	std::regex xmlRegex(regexText);
    	cout << regexText << endl;
    	bool isXml=false;
    	string line=string("<?xml version=\"1.0\" encoding=\"UTF-8\"?>");
    	isXml=tr1::regex_match(line.begin(),line.end(),xmlRegex);
    	cout << isXml << endl;
    }

  5. #5
    Membre actif
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2009
    Messages
    389
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2009
    Messages : 389
    Points : 227
    Points
    227
    Par défaut
    Merci pour ton aide, j'ai réussi a construire une regex convenable et plus précise

    Au cas ou certain en aurai besoin
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
     
    bool maClass::isXmlFile(const string& pathfile)
    {
     
    	tr1::regex xmlRegex("<\\?xml\\s*version=\"[1-9]+.\\d*\"\\s*(\\s\\w+=\"[^\"]+\")*\\s*\\?>");
    	ifstream file( pathfile.c_str(), ios::in);
    	bool isXml=false;
     
    	if(file)
    	{
    		string line=string("");
    		getline(file,line);
    		isXml=tr1::regex_match(line.begin(),line.end(),xmlRegex);
     
    		file.close();
    	}
    	return isXml;
    }

Discussions similaires

  1. Problème fonction Regex.Matches(,).Count
    Par maxwel56 dans le forum Silverlight
    Réponses: 4
    Dernier message: 21/06/2010, 14h49
  2. Ajout information dans header xml avec xsl
    Par dumser1 dans le forum XML/XSL et SOAP
    Réponses: 3
    Dernier message: 17/12/2009, 09h26
  3. [ Tomcat ] header <?xml... inclut dans JSPX
    Par Pi2 dans le forum Tomcat et TomEE
    Réponses: 1
    Dernier message: 07/02/2006, 16h17
  4. [Regex]Match d'une regexp avec une chaîne avec caractères spéciaux
    Par gdawirs dans le forum Collection et Stream
    Réponses: 13
    Dernier message: 25/11/2005, 12h24
  5. [Regex] Matching...
    Par billynirvana dans le forum Collection et Stream
    Réponses: 4
    Dernier message: 18/07/2005, 17h16

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo