IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Parser un fichier HTML [Fait]


Sujet :

Langage PHP

  1. #1
    Membre habitué
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    550
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 550
    Points : 193
    Points
    193
    Par défaut Parser un fichier HTML
    Bonjour.

    J'aurais voulu savoir si il existait une sorte de classe une fonction qui permettrait de parser un fichier html un peux comme on pourrais le faire avec simplexml par exemple pour le XML.

    Je m'explique, une page contient ceci.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    <tr class="even sortrow">
    <td class="tournament sortdata">xxxx</td>
    <td class="starttime sortdata">xxxx</td>
    <td class="buyin sortdata">xxxx</td>
    <td class="players sortdata">xxxx</td>
    </tr>
    Faire en sorte de récupérer en quelque sorte le even_sortow->tournament_sortdate ?

    Pourvoir en gros récupérer par balises html, id de balise, voir class de balise.

    Merci à vous.

  2. #2
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    42
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 42
    Points : 27
    Points
    27
    Par défaut
    Juste une idée comme ça mais qui est soumis à beaucoup de facteurs. As tu essayé d'ouvrir la page HTML avec SimpleXML ?
    Bien sur il faut que la page soit valide c'est p-e pas le cas.

  3. #3
    Rédacteur

    Avatar de Yogui
    Homme Profil pro
    Directeur technique
    Inscrit en
    Février 2004
    Messages
    13 721
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yonne (Bourgogne)

    Informations professionnelles :
    Activité : Directeur technique

    Informations forums :
    Inscription : Février 2004
    Messages : 13 721
    Points : 29 985
    Points
    29 985
    Par défaut
    Salut

    As-tu essayé :
    http://fr2.php.net/manual/fr/functio...t-loadhtml.php
    http://fr2.php.net/manual/fr/functio...adhtmlfile.php

    Sachant que tu peux sans doute passer un objet de DOMDocument à SimpleXML sans trop de problèmes

  4. #4
    Membre habitué Avatar de php_de_travers
    Inscrit en
    Juin 2004
    Messages
    460
    Détails du profil
    Informations forums :
    Inscription : Juin 2004
    Messages : 460
    Points : 190
    Points
    190
    Par défaut
    Pour info, lorsque le code html est non-conforme, on obtient une liste de messages d'erreur du genre :

    Warning: DOMDocument::loadHTMLFile() [domdocument.loadhtmlfile]: Unexpected end tag : title in http://xxxxxxxxxxxxxxxx line: 32 in /home/monsite/www/domdocument_01.php on line 3
    Et ça énerve.

  5. #5
    Rédacteur

    Avatar de Yogui
    Homme Profil pro
    Directeur technique
    Inscrit en
    Février 2004
    Messages
    13 721
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yonne (Bourgogne)

    Informations professionnelles :
    Activité : Directeur technique

    Informations forums :
    Inscription : Février 2004
    Messages : 13 721
    Points : 29 985
    Points
    29 985
    Par défaut
    Salut

    Tu peux lancer tidy sur le code HTML avant de l'envoyer à DOMDocument.
    Au passage, c'est une bonne pratique de programmation : vérifier les données avant de les traiter

  6. #6
    Membre habitué Avatar de php_de_travers
    Inscrit en
    Juin 2004
    Messages
    460
    Détails du profil
    Informations forums :
    Inscription : Juin 2004
    Messages : 460
    Points : 190
    Points
    190
    Par défaut
    Je ne veux pas casser l'ambiance, mais je ne dispose pas de tidy. (ovh mutu)

    Il existe aussi une classe qui parse pas trop mal :

    http://simplehtmldom.sourceforge.net/

  7. #7
    Rédacteur

    Avatar de Yogui
    Homme Profil pro
    Directeur technique
    Inscrit en
    Février 2004
    Messages
    13 721
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yonne (Bourgogne)

    Informations professionnelles :
    Activité : Directeur technique

    Informations forums :
    Inscription : Février 2004
    Messages : 13 721
    Points : 29 985
    Points
    29 985
    Par défaut
    Juste pour savoir, as-tu essayé le chargement dynamique d'extensions ? Je ne sais pas si ça fonctionne mais sait-on jamais
    http://fr.php.net/manual/fr/function.dl.php

  8. #8
    Membre habitué Avatar de php_de_travers
    Inscrit en
    Juin 2004
    Messages
    460
    Détails du profil
    Informations forums :
    Inscription : Juin 2004
    Messages : 460
    Points : 190
    Points
    190
    Par défaut
    Je vais le tester...
    Sur un mutualisé OVH, cela suppose certainement de modifier le fichier .htaccess car on n'accède pas à php.ini. Mutualisé oblige.

  9. #9
    Rédacteur

    Avatar de Yogui
    Homme Profil pro
    Directeur technique
    Inscrit en
    Février 2004
    Messages
    13 721
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Yonne (Bourgogne)

    Informations professionnelles :
    Activité : Directeur technique

    Informations forums :
    Inscription : Février 2004
    Messages : 13 721
    Points : 29 985
    Points
    29 985
    Par défaut
    Justement, cette fonction-là (si elle n'est pas interdite par ton hébergeur) permet de charger une extension sans toucher au .htaccess et au php.ini


    [Edit] Cela :
    Citation Envoyé par php_de_travers Voir le message
    on n'accède pas à php.ini. Mutualisé oblige.
    Changera avec PHP 5.3, mais il est vrai que les hébergeurs ne l'adopteront probablement pas de sitôt... cf. http://www.developpez.net/forums/d63...sez-php-5-3-a/

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. parser un fichier HTML avec JAVA
    Par ouinih dans le forum EDI et Outils pour Java
    Réponses: 2
    Dernier message: 09/02/2009, 10h33
  2. parser un fichier html: htmlparser
    Par dalila555 dans le forum Format d'échange (XML, JSON...)
    Réponses: 4
    Dernier message: 24/04/2007, 11h34
  3. parser un fichier html en utilisant java
    Par taouja dans le forum Services Web
    Réponses: 1
    Dernier message: 16/04/2007, 10h12
  4. [C#] Comment lire et parser un fichier html ?
    Par fix105 dans le forum C#
    Réponses: 4
    Dernier message: 28/01/2006, 15h38
  5. parser un fichier html
    Par noarno dans le forum ASP
    Réponses: 2
    Dernier message: 10/12/2003, 17h53

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo