IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Autres Logiciels Discussion :

comment extraire des données d'un fichier PDF


Sujet :

Autres Logiciels

  1. #1
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2014
    Messages
    53
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 32
    Localisation : Mauritanie

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2014
    Messages : 53
    Points : 46
    Points
    46
    Par défaut comment extraire des données d'un fichier PDF
    Bonjour tout le monde

    Je viens de créer une base de données et j'utilise PostgreSQL comme SGBD
    comment puis je extraire des données à partir des fichiers PDF pour le faire entrer dans la base de données ?
    Merci de votre réponse

  2. #2
    Expert éminent sénior
    Avatar de kiki29
    Homme Profil pro
    ex Observeur CGG / Analyste prog.
    Inscrit en
    Juin 2006
    Messages
    6 132
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : ex Observeur CGG / Analyste prog.

    Informations forums :
    Inscription : Juin 2006
    Messages : 6 132
    Points : 11 272
    Points
    11 272
    Par défaut
    Salut, va voir ici : c'est une liste pour naviguer dans Excel / Word / PDF avec Adobe Acrobat Pro et PDFCreator ( il y en a 5 pages ... ).
    Sinon voir ici il te faut Acrobat Pro,
    ou il te faut Acrobat Reader en tenant compte de cette remarque

    il te faudra faire certainement un gros travail de nettoyage et formatage du texte extrait.

    A moins que ces PDFs ne soient des formulaires et dans ce cas voir 41 42 43, il te faudra Acrobat Pro.

  3. #3
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2014
    Messages
    53
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 32
    Localisation : Mauritanie

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2014
    Messages : 53
    Points : 46
    Points
    46
    Par défaut
    Bonjour
    Merci Philippe de votre réponse, mais je n'ai pas bien compris comment faire , je ne connais pas ce genre d'outils avant
    pouvez vous m'expliquer de quoi s'agit il ce code :




    Acrobat Reader Copier/Coller le texte d'un PDF dans une feuille Excel via des SendKeys
    Testé avec Acrobat Reader 11.0

    1ere Version


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    Option Explicit
     
    Sub Pdf2Txt()
    Dim sFichier As String
    Dim sAcro As String
     
        With Feuil1
            .Activate
            .Cells.Clear
            .Range("A1").Select
        End With
     
        sFichier = ThisWorkbook.Path & "\" & "Test.pdf"
        sAcro = "C:\Program Files\Adobe\Reader 11.0\Reader\AcroRD32.exe"
     
        Shell sAcro, vbNormalFocus
     
        SendKeys "^o"
        SendKeys sFichier
        SendKeys "{ENTER}"
     
        SendKeys "^a"
        SendKeys "^c"
        SendKeys "^q"
     
        DoEvents
        With Feuil1
            .Activate
            .Paste
            .Range("B1").Select
        End With
    End Sub



  4. #4
    Expert éminent sénior
    Avatar de kiki29
    Homme Profil pro
    ex Observeur CGG / Analyste prog.
    Inscrit en
    Juin 2006
    Messages
    6 132
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : ex Observeur CGG / Analyste prog.

    Informations forums :
    Inscription : Juin 2006
    Messages : 6 132
    Points : 11 272
    Points
    11 272
    Par défaut
    re, à priori tu ne dois avoir que le Reader ( gratuit ) car Acrobat Pro est payant, donc voir ceci tu n'as qu'à suivre les étapes en insérant les codes exemples dans le VBE Excel et tester sur un de tes PDFs.

  5. #5
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2014
    Messages
    53
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 32
    Localisation : Mauritanie

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2014
    Messages : 53
    Points : 46
    Points
    46
    Par défaut
    Citation Envoyé par kiki29 Voir le message
    re, à priori tu ne dois avoir que le Reader ( gratuit ) car Acrobat Pro est payant, donc voir ceci tu n'as qu'à suivre les étapes en insérant les codes exemples dans le VBE Excel et tester sur un de tes PDFs.

    Ok encore une fois Merci
    Je vais essayer

  6. #6
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2014
    Messages
    53
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 32
    Localisation : Mauritanie

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2014
    Messages : 53
    Points : 46
    Points
    46
    Par défaut
    Bonjour

    Merci de votre aide, mais j'ai toujours des problèmes, en utilisant le code suivant il m'affiche "erreur l indice n appartient pas à la sélection"


    Code VB : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    Sub method2_using_sendkey()
     
    Dim task
     
    ' open the file
     
    ' change the path of adobe program as per your desktop
     
    task = Shell("C:\Program Files (x86)\Adobe\Reader 11.0\Reader\AcroRd32.exe " & "C:\Users\c.cheibani\Desktop\Cours.pdf", vbNormalFocus)
     
     
     
     
    ' wait 2 secs
     
    Application.Wait Now + TimeValue("00:00:2")
     
     
     
     
    'send key to select all text
     
    SendKeys "^a", True
     
     
     
     
    ' wait 2 secs
     
    Application.Wait Now + TimeValue("00:00:2")
     
     
     
     
    ' send key to copy
     
    SendKeys "^c"
     
     
     
     
    ' wait 2 secs
     
    Application.Wait Now + TimeValue("00:00:2")
     
     
     
     
    ' activate this workook and paste the data
     
    'Windows("Cours.xlsm").Activate
    Workbooks.Open "Cours"
     
    Range("a2").Select
     
    ActiveSheet.Paste
     
     
     
     
    ' Activate notepad
     
    AppActivate task
     
     
     
     
    ' send key to close pdf file
     
    SendKeys "^q"
     
    MsgBox "done"
     
    End Sub

  7. #7
    Expert éminent sénior
    Avatar de kiki29
    Homme Profil pro
    ex Observeur CGG / Analyste prog.
    Inscrit en
    Juin 2006
    Messages
    6 132
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : ex Observeur CGG / Analyste prog.

    Informations forums :
    Inscription : Juin 2006
    Messages : 6 132
    Points : 11 272
    Points
    11 272
    Par défaut
    Salut, un échantillon de Sendkeys en PJ qui "fonctionne" ici.Tu verras qu'il reste un gros travail
    de traitement pour remettre en forme le texte importé du pdf.
    Fichiers attachés Fichiers attachés

  8. #8
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2014
    Messages
    53
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 32
    Localisation : Mauritanie

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2014
    Messages : 53
    Points : 46
    Points
    46
    Par défaut
    Bonjour
    Merci encore une fois Philippe de votre aide

    le problème c'est que je veux récupérer juste une partie du texte dans le PDF (par exemple le texte qui suit un mot clé comme coordonnées )

    est ce que c'est possible ?

    vous pouvez voir le fichier ci-joint
    Merci
    Images attachées Images attachées

  9. #9
    Expert éminent sénior
    Avatar de kiki29
    Homme Profil pro
    ex Observeur CGG / Analyste prog.
    Inscrit en
    Juin 2006
    Messages
    6 132
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : ex Observeur CGG / Analyste prog.

    Informations forums :
    Inscription : Juin 2006
    Messages : 6 132
    Points : 11 272
    Points
    11 272
    Par défaut
    Salut,
    Tu verras qu'il reste un gros travail de traitement pour remettre en forme le texte importé du pdf
    , ou ne récupérer que la partie qui t'intéresse.

  10. #10
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2014
    Messages
    53
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 32
    Localisation : Mauritanie

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2014
    Messages : 53
    Points : 46
    Points
    46
    Par défaut
    Salut
    Merci encore une fois

    Oui Vraiment un gros travail à faire pour mettre le texte en ordre , c'est très couteuse cette méthode

Discussions similaires

  1. [MySQL] Comment extraire des données dans un fichier .svc depuis une page web
    Par pierrot10 dans le forum PHP & Base de données
    Réponses: 1
    Dernier message: 18/12/2013, 13h02
  2. [PEAR] Extraire des données d'un fichier CSV pour en faire un PDF
    Par kleyde89 dans le forum Bibliothèques et frameworks
    Réponses: 2
    Dernier message: 12/05/2011, 11h16
  3. Réponses: 0
    Dernier message: 09/11/2010, 18h42
  4. Réponses: 8
    Dernier message: 31/10/2007, 10h10
  5. Réponses: 2
    Dernier message: 20/10/2006, 11h49

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo