IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C# Discussion :

parser fichier html avec C#.Net


Sujet :

C#

  1. #1
    Membre du Club
    Inscrit en
    Avril 2010
    Messages
    58
    Détails du profil
    Informations forums :
    Inscription : Avril 2010
    Messages : 58
    Points : 51
    Points
    51
    Par défaut parser fichier html avec C#.Net
    Bonjour à tous

    j'ai besoin de parser un fichier html avec c#.

    je veux lire les noms des balises ainsi que les valeur que contient chaque balise

    Exemple:
    j'ai le fichier html suivant :<html>... <td > bonjour </td> ...</html>
    but:
    rechercher la balise avec le nom "td" et lire la valeur que contient : dans ce cas "bonjour"

    Merci d'avance

  2. #2
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Points : 39 754
    Points
    39 754
    Par défaut
    C'est pas très simple... On pourrait envisager d'utiliser un parser XML, mais la plupart des pages HTML ne sont pas des documents XML valides. Par contre il existe un outil appelé HTML Agility Pack qui permet de parser un fichier HTML avec une bonne tolérance pour les erreurs genre balises non fermées, attributs sans guillemets etc...

  3. #3
    Membre éclairé
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Août 2008
    Messages
    381
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Développeur .NET

    Informations forums :
    Inscription : Août 2008
    Messages : 381
    Points : 766
    Points
    766
    Par défaut
    Si c'est des trucs simples que tu recherches, tu peux utiliser les expressions régulières.

  4. #4
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Points : 39 754
    Points
    39 754
    Par défaut
    Citation Envoyé par PatteDePoule Voir le message
    Si c'est des trucs simples que tu recherches, tu peux utiliser les expressions régulières.
    Les regex sont très mal adaptées à ce genre de choses malheureusement... ça peut marcher, mais c'est à réserver à des cas très simples

    Certaines personnes ont d'ailleurs des idées assez radicales sur la question
    http://stackoverflow.com/questions/1...732454#1732454

  5. #5
    Membre éclairé
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Août 2008
    Messages
    381
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Développeur .NET

    Informations forums :
    Inscription : Août 2008
    Messages : 381
    Points : 766
    Points
    766
    Par défaut
    J'ai suggéré ça car dans une application j'extrais le contenu que je veux d'une page web avec cette méthode. Ça fonctionne bien.

    Mais c'est sur qu'aux moindre changement du code source de la page, je dois modifier mes expressions

    Mais c'est rare que ça arrive (dans mon cas)

  6. #6
    Membre du Club
    Inscrit en
    Avril 2010
    Messages
    58
    Détails du profil
    Informations forums :
    Inscription : Avril 2010
    Messages : 58
    Points : 51
    Points
    51
    Par défaut
    j'ai utilisé le package "HTML Agility Pack" ca fonctionne bien
    merci tomlev

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [XML] Impossible de "parser" un fichier HTML avec simple DOM
    Par tomcat91fr dans le forum Bibliothèques et frameworks
    Réponses: 3
    Dernier message: 11/03/2014, 20h11
  2. parser un fichier HTML avec JAVA
    Par ouinih dans le forum EDI et Outils pour Java
    Réponses: 2
    Dernier message: 09/02/2009, 10h33
  3. Parser un fichier HTML avec HtmlDocument
    Par Seth77 dans le forum C#
    Réponses: 2
    Dernier message: 13/08/2008, 07h52
  4. [DOM] Erreur parser fichier xml avec caractère spéciaux
    Par turcotm dans le forum Format d'échange (XML, JSON...)
    Réponses: 4
    Dernier message: 19/06/2006, 09h01
  5. génrer fichier html avec template
    Par ramir dans le forum Langage
    Réponses: 5
    Dernier message: 19/10/2005, 13h30

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo