IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

VB.NET Discussion :

Parsing HTML avec HtmlAgilityPack et Xpath [Débutant]


Sujet :

VB.NET

  1. #1
    Membre régulier
    Homme Profil pro
    Inscrit en
    Septembre 2012
    Messages
    166
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Septembre 2012
    Messages : 166
    Points : 86
    Points
    86
    Par défaut Parsing HTML avec HtmlAgilityPack et Xpath
    Bonjour à tous,
    j'ai un petit soucis avec le parsing d'une page HTML.
    J'utilise les libs HtmlAgilityPack afin de charger la page html et de creer un Navigator. Ensuite, j'utilise la lib Xpath... mais j'ai un problème à l’exécution du programme.
    j'ai ce message d'erreur :
    La référence d'objet n'est pas définie à une instance d'un objet.

    Ci-dessous mon code :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
     
    Imports HtmlAgilityPack
    Imports System.Xml.XPath
     
    Public Class htmlParser
     
    Public Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
     
            Dim web As New HtmlWeb
            Dim url As String = "http://www.bfmtv.com/economie/entreprise/"
            ' load du document html
            Dim doc As HtmlDocument = web.Load(url)
     
            ' Selection des nodes XPATH
            Dim MesNodes As HtmlNodeNavigator = doc.DocumentNode.CreateNavigator
            Dim xmlNodeIterator As XPathNodeIterator = MesNodes.Select("//div[@class='article_item']")
            Dim toto As String
     
            While xmlNodeIterator.MoveNext()
                ' la ligne ce dessous me génére l'erreur...
                toto = xmlNodeIterator.Current.SelectSingleNode("rub").Value
     
                RichTextBox1.Text &= "----------____________----------" & vbCrLf
                RichTextBox1.Text &= toto
            End While
    end sub
    End class
    ci-dessous l'adresse que j'utilise pour mes tests :
    http://www.bfmtv.com/economie/entreprise/

    Si qlq un à une idée, Merci

    Patrick

  2. #2
    Membre régulier
    Homme Profil pro
    Inscrit en
    Septembre 2012
    Messages
    166
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Septembre 2012
    Messages : 166
    Points : 86
    Points
    86
    Par défaut
    Bonsoir à tous,
    j'ai trouvé.
    voila le code pour ceux que cela intéresserai :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
     
            Dim WebDoc As New HtmlWeb
            Dim HtmlDoc As New HtmlDocument ' = web.Load(TextBox1.Text)
     
            HtmlDoc = WebDoc.Load(TextBox1.Text)
     
            Dim HCollection As HtmlNodeCollection = HtmlDoc.DocumentNode.SelectNodes("//div[@class='article_item']")
     
            Dim counter As Short = 1
     
            For Each node As HtmlNode In HCollection
                RichTextBox1.Text &= vbCrLf & counter & "     --------------------" & vbCrLf
                RichTextBox1.Text &= node.SelectSingleNode("./p[@class='rub']").InnerText
    next
    En revanche si vous avez d'autres idées... elles seront les bienvenues
    Patrick

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [DOM] Parser du html avec DOMDocument et XPath
    Par snorky94 dans le forum Bibliothèques et frameworks
    Réponses: 2
    Dernier message: 22/04/2013, 17h35
  2. [DOM] Extraire du contenu HTML avec Xpath
    Par thunderfear dans le forum Bibliothèques et frameworks
    Réponses: 9
    Dernier message: 01/02/2011, 14h25
  3. Réponses: 4
    Dernier message: 14/05/2010, 15h41
  4. Réponses: 0
    Dernier message: 13/05/2010, 01h53
  5. Parse code HTML avec PHP
    Par naourass dans le forum Langage
    Réponses: 3
    Dernier message: 19/05/2006, 08h12

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo