IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

API standards et tierces Java Discussion :

[INFO] Traitement d'un fichier texte


Sujet :

API standards et tierces Java

  1. #1
    Membre du Club
    Inscrit en
    Mai 2004
    Messages
    91
    Détails du profil
    Informations forums :
    Inscription : Mai 2004
    Messages : 91
    Points : 48
    Points
    48
    Par défaut [INFO] Traitement d'un fichier texte
    Bonjour,
    Je souhaiterais récuperer certaines données d'un fichier (html, et texte) de maniere à générer moi meme un tableau de donnée...
    Quels outils sont les mieux appropriés pour ce genre de demande?
    En existe t il déjà?
    Merci bcp pour vos réponse.

  2. #2
    Nouveau membre du Club
    Profil pro
    Inscrit en
    Septembre 2003
    Messages
    45
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Septembre 2003
    Messages : 45
    Points : 37
    Points
    37
    Par défaut
    Tu peux utiliser la classe StringTokenizer (java.util.StringTokenizer) qui va te parser ton fichier texte.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    StringTokenizer st = new StringTokenizer("this is a test");
         while (st.hasMoreTokens()) {
             System.out.println(st.nextToken());
         }
    qui te donne ca ;

  3. #3
    Membre du Club
    Inscrit en
    Mai 2004
    Messages
    91
    Détails du profil
    Informations forums :
    Inscription : Mai 2004
    Messages : 91
    Points : 48
    Points
    48
    Par défaut
    Je parlais de fichiers textes ou html... et non pas d'une chaine de caracteres...
    Qq un aurait une solution?
    En somme, je cherche à récuperer certaines données ds un fichier html ou autres... c si dur?

  4. #4
    Membre régulier
    Inscrit en
    Avril 2004
    Messages
    68
    Détails du profil
    Informations forums :
    Inscription : Avril 2004
    Messages : 68
    Points : 72
    Points
    72
    Par défaut
    Ce n'est pas dur, mais il semble te manquer quelques bases.

    Tu devrais déjà lire Le système d’E/S de Java, puis réfléchir à la façon dont tu vas organiser tes données dans le fichier.

    En tous cas, au départ, je te conseille de choisir les fichiers textes avec des infos ligne par ligne, et de voir pour plus tard les fichiers html, beaucoup plus difficiles à analyser.

  5. #5
    Membre régulier Avatar de jerome.petit
    Inscrit en
    Novembre 2002
    Messages
    78
    Détails du profil
    Informations forums :
    Inscription : Novembre 2002
    Messages : 78
    Points : 96
    Points
    96
    Par défaut
    pour HTML tu pourrais peut être t'en sortir avec un analyseur Sax ?

  6. #6
    oca
    oca est déconnecté
    Membre averti
    Profil pro
    Inscrit en
    Octobre 2004
    Messages
    354
    Détails du profil
    Informations personnelles :
    Âge : 51
    Localisation : Suisse

    Informations forums :
    Inscription : Octobre 2004
    Messages : 354
    Points : 421
    Points
    421
    Par défaut
    SAX ne sera pas forcement le plus simple car les document html ne
    sont pas forcement 'bien formé'

    Donc pour le HTML, le plus simple est d'utiliser... un parser HTML !
    ce qui ns amène donc à la question suivante:
    Mais ou trouver un parser HTML ?

    ici :
    http://java-source.net/open-source/html-parsers

    Ce qui amène la 3ème question : lequel choisir :-)

    Moi j'ai utilisé Jericho HTML Parser qui m'a bien plus.

    Ceci dit, si tu doit parser du text et/ou du html, il existe des solutions
    élégantes pour choisir la stratégie à adopter.
    C'est ce que l'on apelle un Design Pattern

    Je te recomande les patterns suivant :

    Factory, Strategy et Visitor (Pour le parsing)

    le codage par Design pattern demande un petit investissement,
    mais cela vaut la paine je crois. Il y a pas mal du tutoriels sur
    les design patterns sur le web

    A+
    Olivier

  7. #7
    Membre du Club
    Inscrit en
    Mai 2004
    Messages
    91
    Détails du profil
    Informations forums :
    Inscription : Mai 2004
    Messages : 91
    Points : 48
    Points
    48
    Par défaut
    super je vais voir tout ça!
    Merci!

  8. #8
    Membre régulier
    Inscrit en
    Novembre 2004
    Messages
    76
    Détails du profil
    Informations forums :
    Inscription : Novembre 2004
    Messages : 76
    Points : 88
    Points
    88
    Par défaut pour extraire des infos...
    pour extraire des infos de formats dont on connait la structure le plus simple est d'utiliser des outils existants, les ETL (Extract Transform Load).

    ils te permettent d extraire des infos de n importe quel format vers un autre

    ca peut etre adapté a ton cas

    qques ETL (open source bien sur... ;-)):

    cloverETL: http://cloveretl.berlios.de/
    Enhydra octopus: http://octopus.objectweb.org/
    Waddle

  9. #9
    Membre du Club
    Inscrit en
    Mai 2004
    Messages
    91
    Détails du profil
    Informations forums :
    Inscription : Mai 2004
    Messages : 91
    Points : 48
    Points
    48
    Par défaut
    ok! mais là faut que je trouve comment on s'en sert...
    Merci

  10. #10
    Membre régulier
    Profil pro
    Inscrit en
    Mars 2006
    Messages
    201
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2006
    Messages : 201
    Points : 88
    Points
    88
    Par défaut
    Citation Envoyé par oca
    Je te recomande les patterns suivant :

    Factory, Strategy et Visitor (Pour le parsing)
    Salut,

    Peux tu nous préciser l'utilisation des 2 premiers pattern dans notre cas stp?

    Dans mon cas je dois realiser un convertisseur xml <-> 3 formats différents.

    J'aurais donc un parseur pour chaque format texte différent et j'ai la sensation ;-) qu'il serait mieux d'utiliser dans ce cas la des design patterns. Dans mon cas au lieu de Strategy ca ne serait pas mieux TemplateMethod?

    Laurent

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Traitement d'un fichier texte
    Par Vincinho dans le forum VB.NET
    Réponses: 1
    Dernier message: 21/04/2010, 15h48
  2. requete de traitement d'un fichier texte
    Par AlternantOracle dans le forum Langage
    Réponses: 2
    Dernier message: 07/12/2009, 15h32
  3. Traitement d'un fichier texte.
    Par riou34 dans le forum 4D
    Réponses: 4
    Dernier message: 25/01/2009, 12h23
  4. traitement d'un fichier texte
    Par benselma dans le forum Général Java
    Réponses: 4
    Dernier message: 14/05/2008, 16h26
  5. Réponses: 8
    Dernier message: 14/09/2006, 16h43

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo