IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++ Discussion :

Extraire un domaine, sous domaine et la page d'une URL


Sujet :

C++

  1. #1
    Membre du Club
    Inscrit en
    Mars 2006
    Messages
    95
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 95
    Points : 60
    Points
    60
    Par défaut Extraire un domaine, sous domaine et la page d'une URL
    Bonjour

    J'ai des urls du type :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    http://www.patate.com/youpy/page.html
     
    http://coucou.patate.com/tagada/plop/pwet/sboum/pageeee.php
     
    http://yop.yap.yip/patate.com/glurp/pwet/autrepage.com
    J'aimerai les séparer en 3 champs :

    les sous-domaines :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    coucou
    yop.yap.yip
    mais également www que je voudrai considérer comme un sous domaine.
    les domaines :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    patate.com, patate.fr, hopla.eu ...
    les pages :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    youpy/page.html
    tagada/plop/pwet/sboum/pageeee.php
    glurp/pwet/autrepage.com

    J'essai avec des regexs, mais je m'arrache les cheveux. En fait le sous domaine c'est entre http:// et .tld/
    soit qqch comme http:// ( ce que je veux ) .tld/
    le problème c'est que si je lui dit que c'est entre les http et .tld/ il essai de me matcher la string la plus longue possible (donc il va chercher le slash très loin...).

    Pour le domaine et la page, j'ai les même problèmes.



    Ca fait plusieurs heures que je suis dessus et je ne m'en sort pas.

    Auriez vous une idée svp? ou alors une technique plus simple en faisant une sorte de split comme en perl?

    Merci pour votre aide.

  2. #2
    yan
    yan est déconnecté
    Rédacteur
    Avatar de yan
    Homme Profil pro
    Ingénieur expert
    Inscrit en
    Mars 2004
    Messages
    10 033
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Ingénieur expert
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Mars 2004
    Messages : 10 033
    Points : 13 968
    Points
    13 968
    Par défaut
    as tu essayer de regarder dans les algo de la STL, que tu pourrai applique sur une string
    Tuto sur les algo :
    http://r0d.developpez.com/articles/algos-stl/

  3. #3
    Membre du Club
    Inscrit en
    Mars 2006
    Messages
    95
    Détails du profil
    Informations forums :
    Inscription : Mars 2006
    Messages : 95
    Points : 60
    Points
    60
    Par défaut
    J'ai finalement trouvé comment faire. Je vous indique la solution, au cas où d'autre aurai le même problème. C'est toujours pénible de trouver qqn qui a exactement le même problème et qui n'indique pas la solution :

    voici la regex :

    boost::regex rexp(".*http:\\/\\/(.+?)\\.(\\w+\\.\\w+)\\/(.*\"*.*)");

    dans la 1ère parenthèse il y a le sous domaine (je considère les 3 ww comme étant le sous domaine), dans la 2ème le nom de domaine et dans la 3ème le reste.

    J'en suis arrivé à bout à l'aide de +? qui permet de dire 1 ou plusieurs, mais qui ne va pas matcher le plus loin possible. +? est "non gourmant", il s'arrêtera dès qu'il aura trouvé ce qu'on cherche.

    par exemple :

    si on a la chaine : blabla/pwet/coucou.html

    (.+)/ matchera blabla/pwet

    mais avec :

    (.+?)/ on matchera : blabla

    J'espère que je suis clair (si ça peut servir un jour...).

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. urlrewriting => sous-domaine -> sous-domaine.php
    Par Anasha dans le forum Apache
    Réponses: 1
    Dernier message: 27/03/2012, 23h29
  2. sous domaines sous IIS7
    Par tirikou dans le forum IIS
    Réponses: 0
    Dernier message: 28/12/2008, 13h49
  3. [Cookies] Sessions/Cookies pour domaine+Sous domaine
    Par Vinzius dans le forum Langage
    Réponses: 1
    Dernier message: 27/07/2007, 12h50
  4. Apache2 + ssl + sous-domaine + multi-domaine
    Par Squyrrel dans le forum Apache
    Réponses: 8
    Dernier message: 28/04/2006, 18h40
  5. Réponses: 2
    Dernier message: 03/11/2005, 09h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo