Bonjour a tous,
je suis nouveau dans le forum.
je fais en ce moment une application sensee digitaliser des documents citoyens, et en particulier segmenter dans ce document les empreintes digitales, la signature, la photographie, etc... (barcodes, texte, etc.).
j'utilise pour ce faire les libs leptonica, opencv et autres libs biometriques mais je n'ai pas toutes les connaissances necessaires pour bien verifier que l'extraction est bonne.
voila en fait l'application doit avoir 2 modes de fonctionnement:
- extraction via templates de definition de page en xml
- extraction 100% automatique
pour le 1, je segmente deja correctement sauf que quand le document a des marges ou est tordu ca fausse le resultat (de plus des fois les items ne sont pas exactement ou ils disent etre). je voudrais savoir comment voir "autour" de ce que j'ai segmente pour etre sur d'avoir pris toute la forme.
pour le 2, je voudrais savoir comment faire. j'ai deja sous leptonica la separation texte / images, ce qui me donne un masque d'extraction. apres j'applique une recherche de contours (via opencv par exemple) pour obtenir les formes. mais ca ne marche pas toujours tres bien (c'est tres sensible aux contrastes et autres...)
est-ce que quelqu'un connait une facon simple de retrouver ces objets ?
les documents sont grayscale.
l'empreinte digitale a d'une certaine facon une morphologie de lignes avec equi-repartition entre blancs et noirs (lignes des empreintes) avec une frequence de x pixels (dependant du dpi de l'image je dirai dans les 5 pixels en 500dpi), les photos ont une repartition d'histogramme assez homogene, le texte est assez dense en noir / blanc, et la signature je ne sais pas du tout comment l'avoir (mais c'est le moins grave de tout).
voila si quelqu'un connait leptonica, opencv, et des facons de faire ca en general avec des libs opensource rapides je serai vraiment content d'avoir votre avis.
pour info lien vers leptonica:
http://www.leptonica.org/highlevel.html
Merci a vous !
Partager