IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Servlets/JSP Java Discussion :

Extraire le contenu de balises HTML d'une page WEB


Sujet :

Servlets/JSP Java

  1. #1
    Candidat au Club
    Profil pro
    Inscrit en
    Janvier 2010
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2010
    Messages : 3
    Points : 2
    Points
    2
    Par défaut Extraire le contenu de balises HTML d'une page WEB
    Bonjour à tous,

    J'ai fait beaucoup de recherches à ce sujet sur le web et différents forums, et impossible de trouver la moindre recommandation précise sur comment récupérer le contenu de pages HTML.
    Dans l'absolu, le plus cool d'utilisation serait soit de générer un tableau directement soit de générer un flux XML qui soit ensuite disponible pour créer le dit tableau.

    Prenons par exemple la page sur la canneberge de wikipedia (premier truc qui me vient à l'esprit ) : [ame]http://fr.wikipedia.org/wiki/Canneberge[/ame]

    Si on observe le code source, noyé dans toutes les balise,s se trouvent des balises de tableau permettant de générer le tableau de classification sur la droite.
    J'aimerais que mon code récupère les informations situées dans ce tableau, mais je n'ai pas la moindre idée de comment commencer.
    Je pense qu'un code java est le plus apte à cette tache...
    Merci d'avance pour vos réponses.

  2. #2
    Membre régulier
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    111
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 111
    Points : 118
    Points
    118
    Par défaut
    Peux tu préciserl'objectif d'une telle démarche?
    En gros pourquoi tu veux faire ça?

  3. #3
    Candidat au Club
    Profil pro
    Inscrit en
    Janvier 2010
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2010
    Messages : 3
    Points : 2
    Points
    2
    Par défaut
    Mon but est de parcourir plusieurs pages de données pour en faire une synthèse sur une seule et unique page, et probablement un peu de traitement statistique derrière.
    A noter que c'est pour une utilisation strictement personnelle, non pas pour allier spolier du contenu sur un site et le remettre à ma sauce.

  4. #4
    Membre régulier
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    111
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 111
    Points : 118
    Points
    118
    Par défaut
    Trouvé sur le forum :
    A voir avec elle Si ça peut t'aider...

Discussions similaires

  1. Réponses: 2
    Dernier message: 15/05/2014, 20h52
  2. [RegEx] Extraire le contenu de balises HTML
    Par johnstyle dans le forum Langage
    Réponses: 0
    Dernier message: 26/11/2010, 11h55
  3. Recuperer le contenu HTML d'une page web avec FLEX
    Par kididouille dans le forum Flex
    Réponses: 0
    Dernier message: 02/06/2010, 15h45
  4. affichage des balises html dans une page
    Par lecra dans le forum Langage
    Réponses: 2
    Dernier message: 04/02/2010, 13h31
  5. [Système] Récupérer le contenu HTML d'une page Web
    Par zah.hicham dans le forum Langage
    Réponses: 7
    Dernier message: 13/02/2008, 03h53

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo