IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Extraction de metadonnées d'un fichier binaire


Sujet :

Langage Perl

  1. #1
    Futur Membre du Club
    Profil pro
    Inscrit en
    Février 2011
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2011
    Messages : 8
    Points : 6
    Points
    6
    Par défaut Extraction de metadonnées d'un fichier binaire
    Bonjour,

    je dois recuperer toutes les données png d'un fichier dump .
    (Ce fichier dump contient aussi pas mal d'autres type de metadonnées que je dois ignorer)

    je suis un utilisateur occasionnel de Perl et pense procéder comme suit:

    - ouvrir le fichier dump en mode binaire
    - rechercher la 1ere occurence d'une signature png (\x89\x50\x4E\x47\x0D\x0A\x1A\x0A)
    - ouvrir en ecriture le 1er fichier png
    - ecrire dedans la signature
    - continuer a lire le fichier dump et ecrire les données lues dans le fichier png jusqu'a ce que je touve la fin du dernier chunk des données png
    (\x49\x45\x4E\x44\xAE\x42\x60\x82)
    - fermer le 1er fichier png

    - rechercher la 2ere occurence d'une signature png
    - ouvrir en ecriture le 2nd fichier png
    - ecrire dedans la signature ...
    - ...etc... jusqu'a la fin du fichier.



    1) Avant de m'engager dans le codage je voudrais savoir si cet algorithme vous semble réaliste ?
    .

    2) De plus , je n'ai pas bien compris comment on fait pour rechercher une occurence non fixée dans un fichier ouvert en mode binaire.

    J'aurai tendance a faire comme je le ferai en en mode enregistrement
    (bien sur en mode enreg ca ne marcherai pas à cause du CRLF)

    my $pngsign='\x89\x50\x4E\x47\x0D\x0A\x1A\x0A';

    if ( $ligne =~ /$pngsign/ ) {};

    mais comment on gère la boucle de lecture dans ce cas ?


    Cordialement

  2. #2
    Membre averti

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Janvier 2011
    Messages
    184
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Janvier 2011
    Messages : 184
    Points : 322
    Points
    322
    Par défaut
    Il existe un module pour l'extraction des méta-informations sur le CPAN.
    Image::Info, si je ne m'abuse. Il doit certainement traiter le format PNG.

    ais si tu tiens, tout de même, à utiliser ton algorithme, tu devrais changer de méthode (à cause du CLRF, comme tu l'as souligné).
    Ce j'aurai fait :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
     
    tab  = (\x49, \x45, \x4E, \x44, \xAE, \x42, \x60, \x82)
    i = 0
    Pour chaque octet o du fichier
      si o = tab(i) alors
        i = i+1
      sinon
        i = 0
      fi
      si i = taille(tab) alors
        break
      fi
    fin
     
    si i = taille(tab) alors
      afficher("signature png trouve")
    fi

  3. #3
    Futur Membre du Club
    Profil pro
    Inscrit en
    Février 2011
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2011
    Messages : 8
    Points : 6
    Points
    6
    Par défaut
    Merci pour le tuyau . J'essaye d'abord le code perl et ca fonctionne mais le pb c'est que le programme met env 3 a 4 minutes avant
    de rendre le resultat si le fichier dump fait 2 Mo . Sachant que mes vrais dump feront 300 mega en moyenne ..

    c'est peut etre du a la facon dont je manipule les données ,
    (je met le fichier ds une variable et ensuite je la split octet/octet dans un tableau ..)

    voici le code ...


    my ($i,$n)=0;
    my $buffer="";
    my $filename ='monfichierdump';
    my $taille=(stat("$filename"))[7]
    my @pngsign=(0x89,0x50,0x4E,0x47,0x0D,0x0A,0x1A,0x0A);

    open (F,"<$filename");
    binmode(F);
    read(F, $buffer, $filename, 0);
    close(F);

    foreach (split(//, $buffer))

    {

    if ( ord($_) == $pngsign[$i]) {$i++ ;}
    else {$i = 0 ;}

    if ( $i == scalar @pngsign ) {$n++ ;$i=0;printf("%02x",$o);print "\n";}
    }

    print "nombre de fichiers png $n";

    exit;

  4. #4
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    Merci de poster ton code avec des balises CODE (icône ).

    Sinon, une technique plus simple est d'utiliser la fonction index :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    my $buffer;
    my $filename ='monfichierdump';
    my $pngsign = "\x89\x50\x4E\x47\x0D\x0A\x1A\x0A";
     
    open (F,"<$filename");
    binmode(F);
    read(F, $buffer, $filename, 0);
    close(F);
     
    my (@n, $n);
    while (($n = index($buffer, $pngsign, $n)) >= 0) {
      push @n, $n++;
    }
    print "Nombre de fichiers PNG: ", scalar(@n), " aux positions ", join ", ", @n;
    print "\n";

  5. #5
    Futur Membre du Club
    Profil pro
    Inscrit en
    Février 2011
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2011
    Messages : 8
    Points : 6
    Points
    6
    Par défaut
    oui maintenant ca dépote !! mais j'ai du ecrire ton code autrement car ca bugait (le programme boucle sans fin et au debug la variable $n a toujours la valeur 1 ... il y a surement une petite erreur de frappe que je n'ai pas trouvée ..)

    Mon code utilise ton exemple, mais en plus bourrin ..mais bon ca marche ..


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     my (@n, $n, $i);
    $i=0;
    $n=index($buffer, $pngsign, $i); 
     while ( $n != -1 )
        { 
           push @n, $n;$i= $n + 1;
          $n =index($buffer, $pngsign, $i);
     
        }
     
     
    print "Nombre de fichiers PNG: ", scalar(@n), " aux positions ", join ", ", @n ;

  6. #6
    Expert confirmé

    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2009
    Messages
    3 577
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 58
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Avril 2009
    Messages : 3 577
    Points : 5 753
    Points
    5 753
    Par défaut
    J'ai ajouté la parenthèse qui manquait dans mon script. J'ai retesté, et cela fonctionne (sauf que la signature ne fonctionne pas sur des fichiers png de mon cru).

  7. #7
    Futur Membre du Club
    Profil pro
    Inscrit en
    Février 2011
    Messages
    8
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2011
    Messages : 8
    Points : 6
    Points
    6
    Par défaut
    Hello,

    j'avais pas vu la parenthese .. Ca fonctionne effectivement chez moi avec ta boucle.

    Sinon pour la signature png ben, je prends celle donnée par ce site la ..

    http://www.libpng.org/pub/png/spec/1...Structure.html


    137 80 78 71 13 10 26 10 ce qui nous fait bien \x89\x50\x4E\x47\x0D\x0A\x1A\x0A

    Merci à toi en tous cas.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Problème extraction d'un fichier binaire
    Par rayon-gama dans le forum Général Java
    Réponses: 23
    Dernier message: 05/04/2013, 09h08
  2. Réponses: 6
    Dernier message: 08/11/2012, 09h17
  3. ETL : Extraction d'un fichier binaire.
    Par salom22 dans le forum Alimentation
    Réponses: 6
    Dernier message: 06/08/2012, 17h33
  4. Ajout de codes Hexa après extraction d'un fichier binaire
    Par Philippe_Perfect dans le forum Débuter
    Réponses: 6
    Dernier message: 07/06/2010, 20h59
  5. fichier binaire ou texte
    Par soussou dans le forum C++Builder
    Réponses: 4
    Dernier message: 14/06/2002, 13h39

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo