J'ai trouvé un projet sur sourceForge, mais pas très convainquant.
Qqn peut m'aider à trouver mon bonheur ?
J'ai trouvé un projet sur sourceForge, mais pas très convainquant.
Qqn peut m'aider à trouver mon bonheur ?
Qu'appelles tu un "bon" parseur ?
Parce que certains moteurs de template (dont Flexy) incluent un parseur HTML "rudimentaire".
parser du html, de par sa nature, c'est l croix et la bannière !
Effectivement. Justement j'ai déjà fait plusieurs parsing de ce type, mais uniquement sur des pages précises.Envoyé par Mr N.
Comme j'ai dû utiliser des parsers HTML en Java, je me suis demandé s'il n'existait pas également quelque chose de similaire en PHP, histoire d'améliorer mon système de parsing manuel.
DOM est ton ami
enfin presque.
tu peux ouvrir un flux html avec dom domxml_open_file
tu peux jouer avec les parametres
DOMXML_LOAD_PARSING (défaut),
DOMXML_LOAD_VALIDATING
DOMXML_LOAD_RECOVERING <==
DOMXML_LOAD_DONT_KEEP_BLANKS , DOMXML_LOAD_SUBSTITUTE_ENTITIES et DOMXML_LOAD_COMPLETE_ATTRS
tu auras en memoire un arbre dom contenant ta page.
tu peux ensuite la manipuler ajouter modifier des élément et la retourner.
si ton HTML est vraiment trop crade ça plante mais sinon ça marche bien.
A+JYT
Et on peut gérer ce type d'objets avec PHP ?
...Quelqu'un pourrait me dir ce que c un "parser" ?
Je me reprends
sorry mais j'avais plus tout ça en tête
voir la doc de loadHTMLFile
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 $doc = DOMDocument::loadHTMLFile("filename.html"); print $doc->saveHTML(); $doc = new DOMDocument(); $doc->loadHTMLFile("filename.html"); print $doc->saveHTML();
A+JYT
http://fr.wikipedia.org/wiki/ParserEnvoyé par Funraill.net
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager