Bonjour tout le monde
je voudrais réaliser un programme qui fait la recherche des mots dans un pdf
en utilisant le pdfbox (appach.pdfbox librairie)
voici mon petit programme
mais il y a une doute dans ma tete
Code java : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 List<String> words = null ;// List of words PDDocument document = PDDocument.load("D:\\INIT.pdf"); PDFTextStripper s = new PDFTextStripper(); String content = s.getText(document); comparing(content,words);//methode for searching those words on my text System.out.println(content);
1) est il possible de chercher directement dans le pdf sans avoir le text avec getText
2) getText retourne un string "peut il supporter tous le texte dans le pdf ?? " dans le cas
Merci d'avance
Partager