Segmentation / auto-reconnaissance de forme sur document scanné

**kpoman** · 30/08/2010, 14h15

Bonjour a tous,

je suis nouveau dans le forum.

je fais en ce moment une application sensee digitaliser des documents citoyens, et en particulier segmenter dans ce document les empreintes digitales, la signature, la photographie, etc... (barcodes, texte, etc.).

j'utilise pour ce faire les libs leptonica, opencv et autres libs biometriques mais je n'ai pas toutes les connaissances necessaires pour bien verifier que l'extraction est bonne.

voila en fait l'application doit avoir 2 modes de fonctionnement:

- extraction via templates de definition de page en xml
- extraction 100% automatique

pour le 1, je segmente deja correctement sauf que quand le document a des marges ou est tordu ca fausse le resultat (de plus des fois les items ne sont pas exactement ou ils disent etre). je voudrais savoir comment voir "autour" de ce que j'ai segmente pour etre sur d'avoir pris toute la forme.

pour le 2, je voudrais savoir comment faire. j'ai deja sous leptonica la separation texte / images, ce qui me donne un masque d'extraction. apres j'applique une recherche de contours (via opencv par exemple) pour obtenir les formes. mais ca ne marche pas toujours tres bien (c'est tres sensible aux contrastes et autres...)

est-ce que quelqu'un connait une facon simple de retrouver ces objets ?

les documents sont grayscale.

l'empreinte digitale a d'une certaine facon une morphologie de lignes avec equi-repartition entre blancs et noirs (lignes des empreintes) avec une frequence de x pixels (dependant du dpi de l'image je dirai dans les 5 pixels en 500dpi), les photos ont une repartition d'histogramme assez homogene, le texte est assez dense en noir / blanc, et la signature je ne sais pas du tout comment l'avoir (mais c'est le moins grave de tout).

voila si quelqu'un connait leptonica, opencv, et des facons de faire ca en general avec des libs opensource rapides je serai vraiment content d'avoir votre avis.

pour info lien vers leptonica:

http://www.leptonica.org/highlevel.html

Merci a vous !

**pseudocode** · 31/08/2010, 13h32

Bonjour,

Pour la segmentation non supervisée, il est parfois plus simple de définir ce qu'est une bonne frontière de séparation plutot que de définir un bon contenu de région. Par exemple en prenant en compte la distance aux contours des objets, la forme de la ligne frontière, sa longueur, ... Les methodes de segmentation "graph-cut" fonctionnent souvent sur ce principe (minimum d'énergie).

Ce principe peut aussi s'appliquer pour la segmentation par template. Il faut alors chercher une transformation (translation, zoom, ...) du template qui donne la meilleure frontière

Segmentation / auto-reconnaissance de forme sur document scanné

Traitement d'images

Discussions similaires

Partager

Partager