IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Traitement d'images Discussion :

OCR sur ticket de caisse


Sujet :

Traitement d'images

  1. #1
    Nouveau candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2017
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 35
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Novembre 2017
    Messages : 1
    Par défaut OCR sur ticket de caisse
    Bonjour à tous,
    Je suis nouveau sur le forum et j'espère ne pas m'être trompé de rubrique

    Je souhaiterai développer un application Android (puis iOS dans un second temps) permettant à partir d'une photo d'un ticket de caisse d'extraire sous forme de texte, la liste des produits achetés.

    Je suis novice en OCR et je souhaiterai savoir quel script serait le plus adapté (traitement d'image + reconnaissance des caractères)?

    J'ai fait des essais avec certain logiciel d'OCR disponible. Il s'avère que le résultat est souvent insatisfaisant; le texte reconnu est gorgé d'erreurs. Cela est probablement du à la mauvaise qualité du papier et à la mauvaise qualité d'impression.

    Il y-t-il un moyen d'améliorer l'efficacité et la précision d'un OCR ?
    Je pensais peut être par exemple que cela serai possible en:
    - réduisant le nombre de caractères possibles ( Par exemple ne pas chercher à reconnaitre des lettres minuscules car tout le texte est en majuscule)
    - réduisant le nombre de polices possibles ( Par exemple en utilisant uniquement cette police qui semble correspondre à celle des ticket de caisse.
    -etc.

    Merci par avance pour vos réponse

  2. #2
    Expert confirmé
    Avatar de Jipété
    Profil pro
    Inscrit en
    Juillet 2006
    Messages
    11 079
    Détails du profil
    Informations personnelles :
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : Juillet 2006
    Messages : 11 079
    Par défaut
    Citation Envoyé par Hopup17 Voir le message
    Je pensais peut être par exemple que cela serai possible en:
    - réduisant le nombre de caractères possibles ( Par exemple ne pas chercher à reconnaitre des lettres minuscules car tout le texte est en majuscule)
    - réduisant le nombre de polices possibles ( Par exemple en utilisant uniquement cette police qui semble correspondre à celle des tickets de caisse.
    ne pas chercher à reconnaitre : tu as accès au code-source du logiciel d'ocr, pour le recompiler ?
    en utilisant uniquement cette police : tu as accès au paramétrage de l'imprimante ?

    Sinon, si ta reconnaissance de caractères n'est pas bonne, c'est que ton fichier source n'est pas bon : va falloir le nettoyer à la main, et utiliser certains paramètres pour le générer ; fais une recherche globale dans dvlp sur tesseract, j'en ai un peu causé il y a qq années, mais je ne sais plus trop où...

  3. #3
    Membre émérite

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Billets dans le blog
    2
    Par défaut
    Bonjour,

    Je connais deux méthodologies pour extraire du texte.

    Des outils propriétaire ou open source de type OCR avec de bonnes performances pour les propriétaires bien meilleurs que les open sources. Un outil comme Tesseract est mal documenté et compliqué à configurer.

    Si tu veux réduire le périmètre de la reconnaissance, faire un dictionnaire spécifique, le deep-learning est une bonne solution.

    Au plaisir de vous lire,

Discussions similaires

  1. [Tesseract] Reconnaissance de caractères sur un ticket de caisse
    Par torwood3 dans le forum Bibliothèques
    Réponses: 0
    Dernier message: 20/10/2014, 16h52
  2. Erreur Règle d'association sur tickets de caisses
    Par koulifanya dans le forum SAS STAT
    Réponses: 3
    Dernier message: 04/10/2011, 14h48
  3. Réponses: 6
    Dernier message: 04/07/2011, 17h12
  4. Ticket de caisse sur imprimante ITHACA
    Par bois333 dans le forum WinDev
    Réponses: 5
    Dernier message: 17/11/2010, 22h26
  5. [VB]Ticket de caisse
    Par IADJOFOGUE dans le forum VB 6 et antérieur
    Réponses: 4
    Dernier message: 19/01/2006, 22h20

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo