IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

API standards et tierces Java Discussion :

[debutant] Parser HTML


Sujet :

API standards et tierces Java

  1. #1
    Nouveau membre du Club
    Inscrit en
    Mai 2006
    Messages
    33
    Détails du profil
    Informations forums :
    Inscription : Mai 2006
    Messages : 33
    Points : 26
    Points
    26
    Par défaut [debutant] Parser HTML
    Bonjour,

    J'ai un besoin urgent de trouver un parser HTML, dans le cadre d'un projet scolaire. J'ai longuement cherché mais hélas, en vain. Si quelqu'un pouvait m'aider je lui en serais grandement reconnaissant.

    Merci beaucoup.

  2. #2
    Expert éminent sénior
    Avatar de sinok
    Profil pro
    Inscrit en
    Août 2004
    Messages
    8 765
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Août 2004
    Messages : 8 765
    Points : 12 977
    Points
    12 977
    Par défaut
    Euh première recherche sous google avec "parser html java"
    première ligne tu tombes sur ceci: http://java-source.net/open-source/html-parsers, payes ta recherche...

  3. #3
    Nouveau membre du Club
    Inscrit en
    Mai 2006
    Messages
    33
    Détails du profil
    Informations forums :
    Inscription : Mai 2006
    Messages : 33
    Points : 26
    Points
    26
    Par défaut
    Merci bien, mais si ça peut te rassurer, google ça me connait
    Je suis déjà aller sur ce site. C'est même l'un des premiers que j'ai visité. Mais va dans Java Html Parser pour voir... Il y a un lien mort pas loin.
    Je suis pas flémard au point de demander de l'aide alors que je n'ai pas fais la moindre recherche.

  4. #4
    Expert éminent sénior
    Avatar de sinok
    Profil pro
    Inscrit en
    Août 2004
    Messages
    8 765
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Août 2004
    Messages : 8 765
    Points : 12 977
    Points
    12 977
    Par défaut
    Sur la même page tu as quand même quatre ou cinq parsers différentes, donc si il y a un lien mort tu en prends un autre....

    http://people.apache.org/~andyc/neko/doc/html/
    http://htmlparser.sourceforge.net/
    http://jerichohtml.sourceforge.net/doc/index.html

    Viennent tous de l'adresse que je t'ais filé

  5. #5
    Nouveau membre du Club
    Inscrit en
    Mai 2006
    Messages
    33
    Détails du profil
    Informations forums :
    Inscription : Mai 2006
    Messages : 33
    Points : 26
    Points
    26
    Par défaut
    Merci, je m'étais focalisé sur le "Java". Je regarde si ce n'est pas trop compliquer à faire fonctionner : noob oblige
    Merci

  6. #6
    Nouveau membre du Club
    Inscrit en
    Mai 2006
    Messages
    33
    Détails du profil
    Informations forums :
    Inscription : Mai 2006
    Messages : 33
    Points : 26
    Points
    26
    Par défaut
    J'ai finalement réussi à faire fonctionner Jericho, mais j'ai un problème avec les caractères accentués.. Ils sont remplacés par des '?'. Surement parce que c'est un programme anglais, mais je n'arrive pas à rectifier l'erreur.

  7. #7
    Nouveau membre du Club
    Inscrit en
    Mai 2006
    Messages
    33
    Détails du profil
    Informations forums :
    Inscription : Mai 2006
    Messages : 33
    Points : 26
    Points
    26
    Par défaut
    C'est bon ça marche ! Jericho le fait très bien !
    Merci

  8. #8
    Expert éminent sénior
    Avatar de sinok
    Profil pro
    Inscrit en
    Août 2004
    Messages
    8 765
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Août 2004
    Messages : 8 765
    Points : 12 977
    Points
    12 977
    Par défaut
    Petit tag résolu dans ce cas?

  9. #9
    Membre expérimenté
    Avatar de RanDomX
    Profil pro
    sans
    Inscrit en
    Mars 2003
    Messages
    579
    Détails du profil
    Informations personnelles :
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : sans

    Informations forums :
    Inscription : Mars 2003
    Messages : 579
    Points : 1 366
    Points
    1 366
    Par défaut
    POur les avoir tous testé dans le cadre d'un projet d'envergure en entreprise, je te conseille vivement Neko, tu galèreras moins par la suite.

    Bcp de surprise et de trucs non géré par les autres...

    http://people.apache.org/~andyc/neko/doc/html/

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [HELP] Modélisation d'un parser HTML
    Par dazulu dans le forum Langages de programmation
    Réponses: 11
    Dernier message: 31/07/2006, 01h03
  2. Parser HTML
    Par Mucsy dans le forum MFC
    Réponses: 3
    Dernier message: 02/01/2006, 15h49
  3. [debutant]parser un fichier
    Par morphisme dans le forum Langage
    Réponses: 2
    Dernier message: 27/12/2005, 19h00
  4. [Système] Existe-t-il un bon parser HTML pour PHP ?
    Par MiJack dans le forum Langage
    Réponses: 8
    Dernier message: 25/10/2005, 11h18
  5. [Parser HTML] quel parser utiliser pour du HTML 4.0 ?
    Par Cyber@l dans le forum API standards et tierces
    Réponses: 5
    Dernier message: 19/07/2004, 19h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo