IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

VB 6 et antérieur Discussion :

[VB]parser HTML


Sujet :

VB 6 et antérieur

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    188
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2004
    Messages : 188
    Points : 121
    Points
    121
    Par défaut [VB]parser HTML
    Bonjour,
    je suis un vrai débutant en VB, et je cherche à faire une petite application qui permet de générer des fichier CSV ou XML qui contiendraient des informations récupérées sur allociné.
    J'arrive à récupèrer le contenu HTML, mais après je n'ai aucune idée sur le moyen de parser le HTML pour pouvoir générer mon fichier CSV ou XML.
    Voici un style de page que j'aimerai parser :
    http://www.allocine.fr/series/episod...cserie=55.html

    En fait j'aimerai récupèrer les informations des diffèrents épisodes.

    Est ce que quelqu'un pourrait m'aider ou me donner des indications ?

    Merci d'avance :

  2. #2
    Membre éprouvé
    Avatar de méphistopheles
    Profil pro
    Inscrit en
    Janvier 2005
    Messages
    1 551
    Détails du profil
    Informations personnelles :
    Âge : 37
    Localisation : France

    Informations forums :
    Inscription : Janvier 2005
    Messages : 1 551
    Points : 1 218
    Points
    1 218
    Par défaut
    excuse-moi, je suis quelque peu ignorant des termes technique: que signifie "Parser"?

    merci.


    salut

  3. #3
    Expert éminent
    Avatar de ThierryAIM
    Homme Profil pro
    Inscrit en
    Septembre 2002
    Messages
    3 673
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Secteur : Industrie

    Informations forums :
    Inscription : Septembre 2002
    Messages : 3 673
    Points : 8 524
    Points
    8 524
    Par défaut
    Citation Envoyé par méphistopheles
    que signifie "Parser"?
    Explorer, Analyser

  4. #4
    Membre régulier
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    188
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2004
    Messages : 188
    Points : 121
    Points
    121
    Par défaut
    exactement

  5. #5
    Membre éprouvé
    Avatar de méphistopheles
    Profil pro
    Inscrit en
    Janvier 2005
    Messages
    1 551
    Détails du profil
    Informations personnelles :
    Âge : 37
    Localisation : France

    Informations forums :
    Inscription : Janvier 2005
    Messages : 1 551
    Points : 1 218
    Points
    1 218
    Par défaut
    ce qui ne m'éclaire pas vraiment sur ce qu'il veut faire.... rechercher des balises? le traduire?...

    salut

  6. #6
    Membre régulier
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    188
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2004
    Messages : 188
    Points : 121
    Points
    121
    Par défaut
    ben en fait tu vois j'aimerai faire un fichier CSV en récupèrant les informations de la page HTML, un fichier du type :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    nom épisode 1;Titre original;réalisateur;écrit par;résumé;acteurs
    nom épisode 2;Titre original;réalisateur;écrit par;résumé;acteurs
    nom épisode 3;Titre original;réalisateur;écrit par;résumé;acteurs
    ....

  7. #7
    Membre éprouvé
    Avatar de méphistopheles
    Profil pro
    Inscrit en
    Janvier 2005
    Messages
    1 551
    Détails du profil
    Informations personnelles :
    Âge : 37
    Localisation : France

    Informations forums :
    Inscription : Janvier 2005
    Messages : 1 551
    Points : 1 218
    Points
    1 218
    Par défaut
    connais-tu la sintaxe générique utilisée par allociné? c'est à dire, est-ce que c'est le même type de présentation pour chaqu page: les nom sont dits dans le même ordre entre des prase codes habituels ext...
    Si oui, il te suffit de faire des instr ou bien un replace. (suivi d'un left)

    salut

  8. #8
    Expert éminent sénior

    Homme Profil pro
    Inscrit en
    Août 2005
    Messages
    3 317
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Secteur : Industrie

    Informations forums :
    Inscription : Août 2005
    Messages : 3 317
    Points : 20 147
    Points
    20 147
    Par défaut
    bonsoir

    cette macro est du VBA Excel , mais tu pourras facilement l'adapter en VB
    la procedure necessite d'activer la reference Microsoft Internet Controls


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    Option Explicit
     
    Sub extractionDonneesPageHtml()
    'necessite d'activer la reference Microsoft Internet Controls
    Dim IE As InternetExplorer
    Dim nFile As Integer
    Dim infosLigne As String
    Dim i As Byte
    Dim Lig As Boolean
     
    Set IE = CreateObject("InternetExplorer.Application")
     
    With IE
        .Visible = False
        .Silent = True
        .Navigate "http://www.allocine.fr/series/episodes_gen_csaison=118&cserie=55.html"
        Do Until .ReadyState = READYSTATE_COMPLETE
        DoEvents
        Loop 'attend la fin du chargement
     
        nFile = FreeFile
        Open "C:\test.txt" For Output Shared As #nFile
        Print #nFile, .Document.DocumentElement.InnerText
        Close #nFile
        .Quit
    End With
     
    Set IE = Nothing
     
    Lig = False
     
    Open "C:\test.txt" For Input As #1
    Do While Not EOF(1)
    Line Input #1, infosLigne
        If Left(infosLigne, 7) = "Episode" Then
        i = i + 1
        Cells(i, 1) = Mid(infosLigne, InStr(1, infosLigne, "-") + 2, _
        Len(infosLigne) - InStr(1, infosLigne, "-"))
        End If
     
        If Lig = True Then
        Cells(i, 6) = infosLigne
        Lig = False
        End If
     
        If Left(infosLigne, 14) = "Titre original" Then
        Cells(i, 2) = Mid(infosLigne, InStr(1, infosLigne, ":") + 2, _
        Len(infosLigne) - InStr(1, infosLigne, ":"))
        Lig = True
        End If
     
        If Left(infosLigne, 11) = "Réalisé par" Then _
        Cells(i, 3) = Mid(infosLigne, InStr(1, infosLigne, ":") + 2, _
        Len(infosLigne) - InStr(1, infosLigne, "-"))
     
        If Left(infosLigne, 9) = "Ecrit par" Then _
        Cells(i, 4) = Mid(infosLigne, InStr(1, infosLigne, ":") + 2, _
        Len(infosLigne) - InStr(1, infosLigne, ":"))
     
        If Left(infosLigne, 19) = "Acteurs secondaires" Then _
        Cells(i, 5) = Mid(infosLigne, InStr(1, infosLigne, ":") + 2, _
        Len(infosLigne) - InStr(1, infosLigne, ":"))
     
    Loop
    Close #1
     
    Kill "C:\test.txt"
    End Sub

    bonne soiree
    michel

  9. #9
    Membre régulier
    Profil pro
    Inscrit en
    Novembre 2004
    Messages
    188
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2004
    Messages : 188
    Points : 121
    Points
    121
    Par défaut
    merci je vais tester ça demain , merci encore

Discussions similaires

  1. [HELP] Modélisation d'un parser HTML
    Par dazulu dans le forum Langages de programmation
    Réponses: 11
    Dernier message: 31/07/2006, 01h03
  2. [debutant] Parser HTML
    Par Akwel91 dans le forum API standards et tierces
    Réponses: 8
    Dernier message: 24/05/2006, 23h24
  3. Parser HTML
    Par Mucsy dans le forum MFC
    Réponses: 3
    Dernier message: 02/01/2006, 15h49
  4. [Système] Existe-t-il un bon parser HTML pour PHP ?
    Par MiJack dans le forum Langage
    Réponses: 8
    Dernier message: 25/10/2005, 11h18
  5. [Parser HTML] quel parser utiliser pour du HTML 4.0 ?
    Par Cyber@l dans le forum API standards et tierces
    Réponses: 5
    Dernier message: 19/07/2004, 19h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo