Bonjour,
Je cherche à faire un programme qui extrait du texte d'un document PDF.
Je m'explique. J'ai un document PDF de X pages toutes formées selon une trame identique (tel endroit la date, tel endroit un numéro insee avec la chaine "N° insee :" devant, etc...)
J'aimerai pouvoir parcourir toutes les pages de ce fichier pdf et extraire les X numéros insee présents.
L'activex Acrobat Reader permet facilement d'ouvrir et de se positionner sur telle ou telle page d'un document PDF mais je n'arrive pas à trouver de fonction genre FindText ou SelectText.
Quelqu'un connait-il des composants (gratuits) qui permettent de faire ce genre de chose ?
Je ne cherche pas à modifier des PDF, je veux juste lire du texte dedans.
Merci pour vos réponses.
Nico
Partager