IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Extraire les caractères d'une chaine sans séparateur


Sujet :

Shell et commandes GNU

  1. #1
    Membre habitué
    Profil pro
    Inscrit en
    Février 2011
    Messages
    176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Secteur : Industrie

    Informations forums :
    Inscription : Février 2011
    Messages : 176
    Points : 133
    Points
    133
    Par défaut Extraire les caractères d'une chaine sans séparateur
    Bonjour,

    je veux séparer tous les caractères écrits dans mon fichier texte par des espaces, par exemple :

    fichier d'entrée contient : je dois finir mon travail ! ce soir, oui
    fichier sortie : j e d o i s f i n i r m o n t r a v a i l ! c e s o i r , o u i
    la commande split nécessite la spécification d'un séparateur , alors mon texte contient beaucoup de ponctuations et j'ai pas de séparateur entre caractère.

    Est ce quelqu'un a une idée comment résoudre ça, je débute en shell

    Merci d'avance

  2. #2
    Membre averti
    Profil pro
    Inscrit en
    Mai 2009
    Messages
    196
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Mai 2009
    Messages : 196
    Points : 358
    Points
    358
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sed "s/./& /g" oldFile > newFile
    par contre j'ai rien compris à la suite concernant le split ...

  3. #3
    Membre habitué
    Profil pro
    Inscrit en
    Février 2011
    Messages
    176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Secteur : Industrie

    Informations forums :
    Inscription : Février 2011
    Messages : 176
    Points : 133
    Points
    133
    Par défaut
    pour split j'ai voulu au début l'utiliser pour résoudre mon problème, mais ça donne rien

    Merci bien,



    ça fonctionne bien si mon texte ne contient pas de caractère accentués, mais dans le cas ou j'ai par exemple en entrée
    île , bâtiment
    le résultat est
    îl e , bâ t i m e n t
    !!!!

  4. #4
    Membre habitué
    Profil pro
    Inscrit en
    Février 2011
    Messages
    176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Secteur : Industrie

    Informations forums :
    Inscription : Février 2011
    Messages : 176
    Points : 133
    Points
    133
    Par défaut
    Quelle option permet de traiter les caractères accentués ?

    merci

  5. #5
    Expert éminent

    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    1 946
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 946
    Points : 6 276
    Points
    6 276
    Par défaut
    Salut,

    Sur quel système es-tu ?
    Quelle version de sed?

    Normalement c'est censé marcher

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    $ echo "île , bâtiment" | sed 's/./& /g'
    î l e   ,   b â t i m e n t
    Et pour harminiser le tout, la suppression des espaces devrait être faite en amont :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    $ echo "île , bâtiment" | sed 's/ //g;s/./& /g'
    î l e , b â t i m e n t

  6. #6
    Membre averti
    Profil pro
    Inscrit en
    Mai 2009
    Messages
    196
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Mai 2009
    Messages : 196
    Points : 358
    Points
    358
    Par défaut
    Haaa ce bon utf8

    essaye ça pour voir ?

    iconv -f latin1 -t utf8 oldFile| sed "s/./& /g" | iconv -f utf8 -t latin1 > newFile

  7. #7
    Membre habitué
    Profil pro
    Inscrit en
    Février 2011
    Messages
    176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Secteur : Industrie

    Informations forums :
    Inscription : Février 2011
    Messages : 176
    Points : 133
    Points
    133
    Par défaut
    Salut,

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    $ echo "île , bâtiment" | sed 's/ //g;s/./& /g'
    Pour harmoniser oui mais elle n'a pas traité les caractères accentués

    Je suis sur ubuntu 10.04 ,
    version du sed est

    This file documents version 4.2.1 of GNU `sed', a stream editor
    @mvvvv

    Oui ça fonctionne votre solution, mais pouvez vous m'expliquer votre ligne de commande


    Merci à tous

  8. #8
    Membre averti
    Profil pro
    Inscrit en
    Mai 2009
    Messages
    196
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Mai 2009
    Messages : 196
    Points : 358
    Points
    358
    Par défaut
    visiblement votre fichier est en latin-1 (et non utf8)

    votre sed sait manipuler utf8 donc le temps du formatage on met le fichier en encodage utf8

    puis on le remet en latin-1

  9. #9
    Membre habitué
    Profil pro
    Inscrit en
    Février 2011
    Messages
    176
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Secteur : Industrie

    Informations forums :
    Inscription : Février 2011
    Messages : 176
    Points : 133
    Points
    133
    Par défaut
    ok , bien

    merci

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Fonction permettant d'extraire les Lettres d'une chaine de caractères
    Par volubiliss dans le forum Macros et VBA Excel
    Réponses: 8
    Dernier message: 04/09/2010, 08h49
  2. [WD14] Extraire les caractères d'une chaine
    Par fhmayn dans le forum WinDev
    Réponses: 7
    Dernier message: 30/10/2009, 10h12
  3. [MySQL] extraire les chiffres d'une chaine
    Par megane dans le forum Langage SQL
    Réponses: 4
    Dernier message: 23/08/2006, 15h29
  4. Extraire les mots d'une chaine
    Par hsouna dans le forum C++
    Réponses: 2
    Dernier message: 26/06/2006, 18h12
  5. Comment extraire des caractères d'une chaine ?
    Par Powa87 dans le forum Langage
    Réponses: 16
    Dernier message: 01/01/2005, 20h00

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo