IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

savoir si un fichier est texte ou binaire


Sujet :

Langage PHP

  1. #1
    Rédacteur

    Avatar de khayyam90
    Homme Profil pro
    Architecte de système d’information
    Inscrit en
    Janvier 2004
    Messages
    10 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Architecte de système d’information

    Informations forums :
    Inscription : Janvier 2004
    Messages : 10 369
    Points : 40 164
    Points
    40 164
    Par défaut savoir si un fichier est texte ou binaire
    Bien le bonjour,

    Ma problématique du jour concerne les fichiers. J'aimerais savoir si un fichier stocké sur le disque dur est affichable à l'écran par du texte ou s'il ne l'est pas.

    Par exemple un exécutable n'est pas affichable, un document word ne l'est pas non plus alors qu'un fichier de texte brut l'est.

    Comment feriez-vous pour déterminer cette caractéristique ?
    L'extension d'un fichier est trop aléatoire.
    Le type mime nécessiterait de connaître tous les types mimes.
    Une regex ?


  2. #2
    Modérateur
    Avatar de sabotage
    Homme Profil pro
    Inscrit en
    Juillet 2005
    Messages
    29 208
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juillet 2005
    Messages : 29 208
    Points : 44 155
    Points
    44 155
    Par défaut
    Une fonction trouvée tel quel :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    function IsBinary($file) 
    { 
      if (file_exists($file)) { 
        if (!is_file($file)) return 0; 
     
        $fh  = fopen($file, "r"); 
        $blk = fread($fh, 512); 
        fclose($fh); 
        clearstatcache(); 
     
        return ( 
          0 or substr_count($blk, "^ -~", "^\r\n")/512 > 0.3 
            or substr_count($blk, "\x00") > 0 
        ); 
      } 
      return 0; 
    }

  3. #3
    Rédacteur

    Avatar de khayyam90
    Homme Profil pro
    Architecte de système d’information
    Inscrit en
    Janvier 2004
    Messages
    10 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Architecte de système d’information

    Informations forums :
    Inscription : Janvier 2004
    Messages : 10 369
    Points : 40 164
    Points
    40 164
    Par défaut
    Merci de ta réponse,

    Le code que tu me proposes semble assez artisanal et peu robuste. La présence d'au moins 30% de tel ou tel caractère n'est pas très fiable
    Personne n'a une autre idée ?

  4. #4
    Membre chevronné Avatar de nosferapti
    Profil pro
    Inscrit en
    Avril 2009
    Messages
    1 157
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2009
    Messages : 1 157
    Points : 1 895
    Points
    1 895
    Par défaut
    pour qu'un fichier est affichable, il faudrait que chaque caractère soit affichable donc tester chaque caractères un après l'autre
    le problème est que maintenant avec Unicode, le nombre de caractères affichable a explosé donc un test strict peut prendre beaucoup de temps

  5. #5
    Rédacteur

    Avatar de khayyam90
    Homme Profil pro
    Architecte de système d’information
    Inscrit en
    Janvier 2004
    Messages
    10 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Architecte de système d’information

    Informations forums :
    Inscription : Janvier 2004
    Messages : 10 369
    Points : 40 164
    Points
    40 164
    Par défaut
    Je viens de lire que la solution utilisée par l'outil diff consiste à rechercher la présence d'au moins un caractère 0 dans le fichier. L'idée est donc de prendre le début du fichier (jusqu'à plusieurs milliers d'octets) et de rechercher les 0.
    Si on en a trouvé au moins un, on considèrera le fichier comme binaire.

  6. #6
    Rédacteur

    Avatar de khayyam90
    Homme Profil pro
    Architecte de système d’information
    Inscrit en
    Janvier 2004
    Messages
    10 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Bas Rhin (Alsace)

    Informations professionnelles :
    Activité : Architecte de système d’information

    Informations forums :
    Inscription : Janvier 2004
    Messages : 10 369
    Points : 40 164
    Points
    40 164
    Par défaut
    Je suis parti sur ça
    Code php : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    function isTextFile($fileName){
    	if (!file_exists($fileName))
    		return false;
     
    	if (!is_file($fileName)) 
    		return false; 
     
    	$fh  = fopen($fileName, "r"); 
    	$file_content = fread($fh, 512); 
    	fclose($fh); 
    	clearstatcache(); 
     
    	if (substr_count($file_content, "\x00") > 0)
    		return false;
     
    	return true;					
    }
    Le choix de prendre 512 octets est arbitraire mais ça me semble un bon compromis entre performance et résultat

  7. #7
    Membre régulier
    Homme Profil pro
    Développeur Web
    Inscrit en
    Juillet 2010
    Messages
    77
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Juillet 2010
    Messages : 77
    Points : 92
    Points
    92
    Par défaut
    euh il suffit de faire un file_get_contents de ton fichier et de tester si le résultat dans la variable "if(is_numeric($resultat)){//binaire}else{//Pas binaire}" nan?

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [C#] Savoir si un fichier est caché
    Par Oberown dans le forum C#
    Réponses: 1
    Dernier message: 19/12/2005, 17h06
  2. comment savoir si un fichier est un lien symbolique?
    Par trotters213 dans le forum C++
    Réponses: 2
    Dernier message: 02/12/2005, 12h55
  3. savoir si un fichier est ouvert
    Par niclalex dans le forum Access
    Réponses: 2
    Dernier message: 12/10/2005, 19h19
  4. Comment savoir qu'un fichier est modifie
    Par moniphal dans le forum Langage
    Réponses: 2
    Dernier message: 02/10/2005, 10h26
  5. Unix - Comment savoir si un fichier est ouvert
    Par freddyboy dans le forum C
    Réponses: 7
    Dernier message: 06/10/2004, 15h53

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo