IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

[SHELL] Lire un fichier au format UTF-16


Sujet :

Shell et commandes GNU

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Avril 2010
    Messages
    81
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2010
    Messages : 81
    Points : 80
    Points
    80
    Par défaut [SHELL] Lire un fichier au format UTF-16
    Bonjour,

    J'ai des problèmes lors d'un parcourt ligne par ligne d'un fichier au format UTF-16. Les caractères de type ễ par exemple ne sont pas correctement retranscrits dans le fichier que je génère au fur et à mesure que mon fichier source est parcourut.

    Quelqu'un à une idée?
    Merci d'avance.

  2. #2
    Invité
    Invité(e)
    Par défaut
    Le mieux devrait être de le convertir en utf8 avant de le traiter.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    iconv -f utf-16 -t utf-8 fichierutf16 > fichierutf8
    Je n'ai plus mon script l'utilisant sous les yeux mais il me semble que c'est bien ça.

  3. #3
    Membre régulier
    Profil pro
    Inscrit en
    Avril 2010
    Messages
    81
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2010
    Messages : 81
    Points : 80
    Points
    80
    Par défaut
    Merci, j'ai fais le test et tout semble OK. Étonnant qu'il n y ait aucunes différences notables entre les caractères, outre l'encodage sur 2 octets...

  4. #4
    Expert éminent sénior Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 276
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 276
    Points : 13 553
    Points
    13 553
    Par défaut
    Bonjour
    Étonnant qu'il n y ait aucunes différences notables entre les caractères, outre l'encodage sur 2 octets...
    Je ne suis pas sûr de comprendre cette phrase. Si tu imagines que UTF8 est codé sur 8 bits et UTF16 est codé sur 16 bits, cela est largement faux.

    Le codage UTF8 peut prendre de 1 à 4 octets. Pour savoir s'il faut continuer à lire le caractère, il y a un système de "stop ou encore". Comme on écrit 23 et non pas 0000000023.

    Au final, on ne fait pas tenir plus de caractères dans l'UTF16 que dans l'UTF8.

    Après, c'est juste une table de correspondance.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 0
    Dernier message: 27/08/2013, 17h23
  2. [shell]Lire un fichier properties
    Par floctc dans le forum Linux
    Réponses: 6
    Dernier message: 23/01/2011, 12h45
  3. [IO] : Pb de lecture d'un fichier au format UTF-8.
    Par Foub dans le forum Entrée/Sortie
    Réponses: 3
    Dernier message: 25/03/2008, 13h33
  4. script shell : lire un fichier et donner pour traitement au script
    Par pc974 dans le forum Shell et commandes GNU
    Réponses: 1
    Dernier message: 14/05/2007, 15h38
  5. Lire un fichier en korn shell
    Par declencher dans le forum Linux
    Réponses: 5
    Dernier message: 23/03/2005, 16h30

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo