IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

XSL/XSLT/XPATH XML Discussion :

Aide à extraire un bloc d'un code HTML/XML


Sujet :

XSL/XSLT/XPATH XML

  1. #1
    Membre habitué Avatar de denissay
    Homme Profil pro
    Inscrit en
    Mars 2006
    Messages
    103
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Mars 2006
    Messages : 103
    Points : 125
    Points
    125
    Par défaut Aide à extraire un bloc d'un code HTML/XML
    Bonjour,

    J'utilise Web-Harvest pour récupérer des données à partir de sites web, le logiciel transforme les pages webs en xml et se base sur les chemins xPath que je lui fourni pour récupérer les données souhaités.

    Maintenant je travaille sur une page de ce format [code source en pastebin]: http://pastebin.com/M07UFUax

    où j'ai montré les bloc que j'aimerai récupérer. chaque bloque doit être retourné comme un seul ensemble.

    le chemin xPath du premier élément du bloc est: //div[@id="layer22"]/b/span[@style="background-color: #FFFF99"]
    je l'ai bien testé et ça donne bien tous les élements "Début de bloc".

    le chemin xPath du dernier élément du bloc est: //div[@id="layer22"]/a[contains(.,"Joindre")]
    je l'ai bien testé et ça donne bien tous les élements "Fin de bloc".

    Maintenant ce que je veux c'est récupérer tous les bloc en entier. Ce que j'ai du mal à réaliser.

    Le chemin xPath devrait retourner un ensemble des blocs visé tel que:
    (cheminXpathRecherché)[1] = tous les élements du bloc 1
    (cheminXpathRecherché)[2] = tous les élements du bloc 2
    ....

    En vous remerciant d'avance

  2. #2
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 560
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 560
    Points : 21 622
    Points
    21 622
    Par défaut
    Cela n'est pas possible.

    Ton Début bloc est situé dans une balise <b> et ton Fin bloc lui, n'y est pas.
    XPath ne peut te regrouper que des balises avec tout leur contenu, pas "commencer au milieu de cette balise et s'arrêter au milieu de celle-ci."

    Si tu as un besoin précis (par exemple, tu te fiches des balises, tu ne veux que le texte qu'elles contiennent,) il existe peut-être un moyen de faire ces regroupements en utilisant les outils avancés de XPath 2.0. Mais, je ne les connais pas.

  3. #3
    Membre habitué Avatar de denissay
    Homme Profil pro
    Inscrit en
    Mars 2006
    Messages
    103
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Mars 2006
    Messages : 103
    Points : 125
    Points
    125
    Par défaut
    Oh, le <b> ne pose pas problème, je sous entendais avoir tous ce qu'il y a entre <b> Début bloc </b> et <b> Fin bloc </b>

  4. #4
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 560
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 560
    Points : 21 622
    Points
    21 622
    Par défaut
    Ben, même raisonnement sur le <div> au-dessus, alors.
    Tu ne peut pas avoir un seul regroupement qui commence au milieu du div et s'arrête un peu plus loin dans le <div>.

    Soit tu le prends en entier, soit chaque truc que tu en prends a son propre index. Tu ne peux pas regrouper "juste un bout de ce <div>" en un seul morceau.

Discussions similaires

  1. Récupérer le code HTML d'une page web à l'aide d'un Socket
    Par Ryu2000 dans le forum Développement Web en Java
    Réponses: 2
    Dernier message: 14/12/2010, 17h25
  2. exécuter le code html du bloc note
    Par ouzzin dans le forum Balisage (X)HTML et validation W3C
    Réponses: 7
    Dernier message: 16/12/2009, 13h13
  3. Une aide sur la modification d'un code HTML/CSS d'un blog
    Par nanas dans le forum Balisage (X)HTML et validation W3C
    Réponses: 3
    Dernier message: 02/08/2007, 14h04
  4. extraire des données d'un code HTML
    Par blueice dans le forum Langage
    Réponses: 5
    Dernier message: 19/08/2004, 19h41

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo