IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C# Discussion :

Parser un fichier HTML avec HtmlDocument


Sujet :

C#

  1. #1
    Membre averti Avatar de Seth77
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Octobre 2005
    Messages
    1 448
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Octobre 2005
    Messages : 1 448
    Points : 410
    Points
    410
    Par défaut Parser un fichier HTML avec HtmlDocument
    Salut

    Je parse un fichier html a l aide de HtmlDocument, j ai le probleme que le fichier html contient un tableau, qui dans une cellule contient egalement un tableau.

    Comment faire pour recupere la liste des TD sans les TD qui sont dans le 2e tableau ?

    thx @+++

  2. #2
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 42
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Points : 39 754
    Points
    39 754
    Par défaut
    peut-être en parcourant récursivement l'arbre des éléments HTML à partir de Body ...
    (je suppose qu'actuellement tu utilises GetElementsByTagName ?)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
     
    private IEnumerable<HtmlElement> FindFirstLevelTD(HtmlElement root)
    {
        foreach (HtmlElement elt in root.Children)
        {
            if (elt.TagName.ToLower() == "td")
            {
                // Si c'est un TD on le renvoie dans l'énumération et on arrête là la récursion
                // On ne récupèrera donc jamais un TD inclus dans un TD
                yield return elt;
            }
            else
            {
                // Sinon on cherche dans les éléments enfants
                foreach(HtmlElement e in FindFirstLevelTD(elt))
                {
                    yield return e;
                }
            }
        }
    }
    ...
     
    // pour obtenir tous les TD de premier niveau du document, on appelle cette méthode sur le Body :
    foreach(HtmlElement in FindFirstLevelTD(htmlDoc.Body)
    {
        // ...
    }

  3. #3
    Membre averti Avatar de Seth77
    Homme Profil pro
    Développeur .NET
    Inscrit en
    Octobre 2005
    Messages
    1 448
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Octobre 2005
    Messages : 1 448
    Points : 410
    Points
    410
    Par défaut
    Ok, je vais essayer. Merci

Discussions similaires

  1. [XML] Impossible de "parser" un fichier HTML avec simple DOM
    Par tomcat91fr dans le forum Bibliothèques et frameworks
    Réponses: 3
    Dernier message: 11/03/2014, 20h11
  2. VB6: Récupération des meta d'une page HTML avec HTMLDocument
    Par Matounet dans le forum VB 6 et antérieur
    Réponses: 10
    Dernier message: 22/09/2011, 07h55
  3. parser fichier html avec C#.Net
    Par medchafik dans le forum C#
    Réponses: 5
    Dernier message: 02/09/2010, 14h58
  4. parser un fichier HTML avec JAVA
    Par ouinih dans le forum EDI et Outils pour Java
    Réponses: 2
    Dernier message: 09/02/2009, 10h33
  5. parser un fichier html
    Par noarno dans le forum ASP
    Réponses: 2
    Dernier message: 10/12/2003, 17h53

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo