IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

[Système] Existe-t-il un bon parser HTML pour PHP ?


Sujet :

Langage PHP

  1. #1
    Membre actif
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2003
    Messages
    422
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : Suisse

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Mai 2003
    Messages : 422
    Points : 243
    Points
    243
    Par défaut [Système] Existe-t-il un bon parser HTML pour PHP ?
    J'ai trouvé un projet sur sourceForge, mais pas très convainquant.
    Qqn peut m'aider à trouver mon bonheur ?

  2. #2
    Membre éclairé
    Avatar de Kioob
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    550
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Septembre 2004
    Messages : 550
    Points : 764
    Points
    764
    Par défaut
    Qu'appelles tu un "bon" parseur ?

    Parce que certains moteurs de template (dont Flexy) incluent un parseur HTML "rudimentaire".

  3. #3
    Expert éminent Avatar de Mr N.
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    5 418
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 5 418
    Points : 6 449
    Points
    6 449
    Par défaut
    parser du html, de par sa nature, c'est l croix et la bannière !

  4. #4
    Membre actif
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2003
    Messages
    422
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : Suisse

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Mai 2003
    Messages : 422
    Points : 243
    Points
    243
    Par défaut
    Citation Envoyé par Mr N.
    parser du html, de par sa nature, c'est l croix et la bannière !
    Effectivement. Justement j'ai déjà fait plusieurs parsing de ce type, mais uniquement sur des pages précises.
    Comme j'ai dû utiliser des parsers HTML en Java, je me suis demandé s'il n'existait pas également quelque chose de similaire en PHP, histoire d'améliorer mon système de parsing manuel.

  5. #5
    Expert éminent
    Avatar de sekaijin
    Homme Profil pro
    Urbaniste
    Inscrit en
    Juillet 2004
    Messages
    4 205
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Urbaniste
    Secteur : Santé

    Informations forums :
    Inscription : Juillet 2004
    Messages : 4 205
    Points : 9 127
    Points
    9 127
    Par défaut
    DOM est ton ami

    enfin presque.

    tu peux ouvrir un flux html avec dom domxml_open_file
    tu peux jouer avec les parametres
    DOMXML_LOAD_PARSING (défaut),
    DOMXML_LOAD_VALIDATING
    DOMXML_LOAD_RECOVERING <==

    DOMXML_LOAD_DONT_KEEP_BLANKS , DOMXML_LOAD_SUBSTITUTE_ENTITIES et DOMXML_LOAD_COMPLETE_ATTRS


    tu auras en memoire un arbre dom contenant ta page.
    tu peux ensuite la manipuler ajouter modifier des élément et la retourner.

    si ton HTML est vraiment trop crade ça plante mais sinon ça marche bien.

    A+JYT

  6. #6
    Membre actif
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Mai 2003
    Messages
    422
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : Suisse

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Mai 2003
    Messages : 422
    Points : 243
    Points
    243
    Par défaut
    Et on peut gérer ce type d'objets avec PHP ?

  7. #7
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Septembre 2005
    Messages
    56
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2005
    Messages : 56
    Points : 32
    Points
    32
    Par défaut
    ...Quelqu'un pourrait me dir ce que c un "parser" ?

  8. #8
    Expert éminent
    Avatar de sekaijin
    Homme Profil pro
    Urbaniste
    Inscrit en
    Juillet 2004
    Messages
    4 205
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Urbaniste
    Secteur : Santé

    Informations forums :
    Inscription : Juillet 2004
    Messages : 4 205
    Points : 9 127
    Points
    9 127
    Par défaut
    Je me reprends

    sorry mais j'avais plus tout ça en tête

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    $doc = DOMDocument::loadHTMLFile("filename.html");
    print $doc->saveHTML();
     
    $doc = new DOMDocument();
    $doc->loadHTMLFile("filename.html");
    print $doc->saveHTML();
    voir la doc de loadHTMLFile

    A+JYT

  9. #9
    Expert éminent
    Avatar de sekaijin
    Homme Profil pro
    Urbaniste
    Inscrit en
    Juillet 2004
    Messages
    4 205
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Urbaniste
    Secteur : Santé

    Informations forums :
    Inscription : Juillet 2004
    Messages : 4 205
    Points : 9 127
    Points
    9 127
    Par défaut
    Citation Envoyé par Funraill.net
    ...Quelqu'un pourrait me dir ce que c un "parser" ?
    http://fr.wikipedia.org/wiki/Parser

Discussions similaires

  1. Connaissez vous un bon filtre HTML en PHP
    Par lounislounis dans le forum Bibliothèques et frameworks
    Réponses: 1
    Dernier message: 01/08/2010, 11h36
  2. Connaissez vous un parser html pour .Net
    Par mobscene dans le forum Framework .NET
    Réponses: 1
    Dernier message: 25/05/2007, 23h06
  3. [HELP] Modélisation d'un parser HTML
    Par dazulu dans le forum Langages de programmation
    Réponses: 11
    Dernier message: 31/07/2006, 01h03
  4. [Parser HTML] quel parser utiliser pour du HTML 4.0 ?
    Par Cyber@l dans le forum API standards et tierces
    Réponses: 5
    Dernier message: 19/07/2004, 19h32
  5. Existe t 'il un bon générateur d'état WEB ?
    Par plichtal dans le forum Autres outils décisionnels
    Réponses: 2
    Dernier message: 10/01/2003, 14h31

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo