Bonjour à tous, je viens vous demander votre avis concernant un parser Java.
J'ai un dossier où se trouve des fichiers : xxx.pdf, xxx.xml, yyy.pdf, yyy.xml etc. avec donc pour chaque fichier pdf son équivalent xml qui décrit les propriétés du fichier.
Ainsi, via les propriétés, je dois charger dans une application le fichier pdf et à l'aide du fichier de description xml je dois renseigner les propriétés.
Il y a plusieurs types de documents pdf qui ont des champs différents, mais la structure reste la même pour tous les pdf:
Sachant que les DATA sont propres a chaque type de document.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14 <DOC> <DESC> <TYPEDOC>CV</CODTYPDOC> <DATA> <CLE>NOM</CLE> <VALEUR>LE BARBARE</VALEUR> </DATA> <DATA> <CLE>PRENOM</CLE> <VALEUR>KEUM</VALEUR> </DATA> ... </DESC> </DOC>
J'ai des contraintes de performances donc je cherche le moyen le plus rapide pour traiter chaque document de façon à renseigner ses propriétés par rapport à son TYPDOC. C'est-à-dire que je souhaite ajouter à mon application un document du type TYPDOC et créer une collection de propriétés qui sera chargée dans mon application.
J'espère avoir été assez clair, merci de votre attention, toute aide est la bienvenue.
Cordialement
Keum
Partager