IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Remplacé des caractères UTF8 erronés dans plusieurs fichiers


Sujet :

Shell et commandes GNU

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    12
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 12
    Points : 11
    Points
    11
    Par défaut Remplacé des caractères UTF8 erronés dans plusieurs fichiers
    Bonjour, j'ai rapidement écrit cette commande pour remplacer des caractères UTF8 mal convertis par phpdocumentor :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
     
    for file in $(find ~/www/public/. -type f); do
      sed 's/À/À/g' < $file > $file.tmp
      sed 's/É/É/g' < $file > $file.tmp
      sed 's/é/é/g' < $file > $file.tmp
      sed 's/è/è/g' < $file > $file.tmp
      sed 's/Ã/à/g' < $file > $file.tmp
      sed 's/ä/ä/g' < $file > $file.tmp
      sed 's/ë/ë/g' < $file > $file.tmp
      sed 's/ï/ï/g' < $file > $file.tmp
      sed 's/â/â/g' < $file > $file.tmp
      sed 's/ê/ê/g' < $file > $file.tmp
      echo $file
      rm -f $file
      mv $file.tmp $file
    done

    mais ça ne semble pas fonctionner. Quelqu'un pourrait me corriger ? (C'est le premier script shell de ma vie).

  2. #2
    Membre chevronné

    Profil pro
    Inscrit en
    Mars 2004
    Messages
    1 296
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2004
    Messages : 1 296
    Points : 1 803
    Points
    1 803
    Par défaut
    je ne pense pas que tu puisse t'en sortir avec sed, celui-ci utilise les tables de caractères courante , et donc "interprete".

    avec tr (man tr) cela devrait être probablement possible.

    sinon le traitement pourrait être réaliser directement avec un outils dedié comme :
    iconv

  3. #3
    Membre éclairé Avatar de BlaireauOne
    Profil pro
    Inscrit en
    Mars 2007
    Messages
    492
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Mars 2007
    Messages : 492
    Points : 652
    Points
    652
    Par défaut
    Citation Envoyé par evaisse
    Bonjour, j'ai rapidement écrit cette commande pour remplacer des caractères UTF8 mal convertis par phpdocumentor :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
     
    for file in $(find ~/www/public/. -type f); do
      sed 's/À/À/g' < $file > $file.tmp
      sed 's/É/É/g' < $file > $file.tmp
      sed 's/é/é/g' < $file > $file.tmp
      sed 's/è/è/g' < $file > $file.tmp
      sed 's/Ã/à/g' < $file > $file.tmp
      sed 's/ä/ä/g' < $file > $file.tmp
      sed 's/ë/ë/g' < $file > $file.tmp
      sed 's/ï/ï/g' < $file > $file.tmp
      sed 's/â/â/g' < $file > $file.tmp
      sed 's/ê/ê/g' < $file > $file.tmp
      echo $file
      rm -f $file
      mv $file.tmp $file
    done

    mais ça ne semble pas fonctionner. Quelqu'un pourrait me corriger ? (C'est le premier script shell de ma vie).


    Comme l'indique MarcG, tu peux utiliser iconv comme ceci :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
     
    for file in $(find ~/www/public/. -type f); do
      iconv -f utf-8 -t ISO-8859-1 $file > ${file}.tmp 
      echo $file
      rm -f $file
      mv ${file}.tmp $file
    done

    En tout cas, ton sed posait problème, format OK :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     
    for file in $(find ~/www/public/. -type f); do
      sed -e 's/À/À/g' \
            -e  's/É/É/g' \
            -e 's/é/é/g' \
            -e  's/è/è/g' \
           (...)
            -e 's/ê/ê/g' < $file > $file.tmp
      echo $file
      rm -f $file
      mv $file.tmp $file
    done

Discussions similaires

  1. Rechercher/remplacer une chaine de caractères dans plusieurs fichiers
    Par _shuriken_ dans le forum Shell et commandes GNU
    Réponses: 5
    Dernier message: 31/07/2011, 20h06
  2. [Batch] Remplacer des caractères dans un fichier texte
    Par Benoit Labbey dans le forum Scripts/Batch
    Réponses: 2
    Dernier message: 09/06/2009, 16h43
  3. [RegEx] remplacer des données dans plusieurs fichiers
    Par sam01 dans le forum Langage
    Réponses: 3
    Dernier message: 11/12/2007, 14h03
  4. Réponses: 1
    Dernier message: 08/09/2006, 16h43
  5. Réponses: 3
    Dernier message: 27/06/2005, 16h24

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo