IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

fonction decode() avec une chaine de caractères


Sujet :

Python

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Avril 2006
    Messages
    35
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Avril 2006
    Messages : 35
    Points : 21
    Points
    21
    Par défaut fonction decode() avec une chaine de caractères
    Bonjour,

    J'utilise la fonction .decode() pour transformer le charset de pages web selon leur format respectif. J'ai un soucis avec un script java inclu dans une page. Je ne vais pas détailler tout le problème (trop long) mais je bloque sur ce détail pourtant simple en apparence:

    Si je veux transformer le caractère '\101' en 'A', il faut taper
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    print '\101'.decode('utf-8')
    Et hop ça me sort un 'A' sur mon terminal

    Pour une raison que je comprends mal ça ne fonctionne pas avec une chaine de caractères:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    str='\\101'
    print str.decode('utf-8')
    Et là il me sort:
    \101
    (au lieu de A)
    ?...

    Et donc je suis bloqué sans trop comprendre ce qui se passe...
    Avez-vous une idée ?

  2. #2
    Membre à l'essai
    Profil pro
    Inscrit en
    Avril 2006
    Messages
    35
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Avril 2006
    Messages : 35
    Points : 21
    Points
    21
    Par défaut
    Je vais un peu préciser car j'ai avancé dans le problème:

    Tant que je joins le code manuellement dans la string ça fonctionne
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    str='\101'.encode('utf-8')
    print str.decode('utf-8')
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    str=u'\101'
    print str.decode('utf-8')
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    str= unicode('\101','utf-8')
    print str
    ==> A

    Par contre dès que j'essaye d'assembler la chaine pour en faire une fonction ça échoue:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    code='101'
    str='\\'+code
    print str.decode('utf-8')
    ou
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    code='101'
    str=u'\\'+code.encode('utf-8')
    print str.decode('utf-8')
    ==> \101

  3. #3
    Candidat au Club
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 2
    Points : 2
    Points
    2
    Par défaut fonction decode
    Il y a simplement une coquille dans la définition de 'str': le premier '\' agit comme un caractère d'échappement dans la chaîne donc "neutralise" le second '\', du coup la chaîne affichée est '\101' et non l'interprétation du code octal 101 qui correspond à 'A'.

    Il suffit donc de supprimer un '\' dans str:

    >>> str = '\101'
    >>> print str.decode('utf-8')
    'A'
    >>>

  4. #4
    Expert éminent sénior
    Avatar de Guigui_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Août 2002
    Messages
    1 864
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2002
    Messages : 1 864
    Points : 10 067
    Points
    10 067
    Par défaut
    '\101' représente 1 caractère et '\\101' en représente 4. Cela n'est donc pas
    la même chose
    et tu ne peux pas créer le caractères '\101' par concaténation d'autres.
    Est-ce que ton objectif, c'est d'obtenir 'A' à partir de 101 ? => il faut passer par la fonction chr ou unichr

  5. #5
    Candidat au Club
    Profil pro
    Inscrit en
    Mars 2009
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2009
    Messages : 2
    Points : 2
    Points
    2
    Par défaut fonction decode (2 ème)
    Nos messages se sont croisés
    Pour répondre au second:

    au lieu de :

    str = '\\' + code

    faire:

    str = chr(int(code,8))

  6. #6
    Membre à l'essai
    Profil pro
    Inscrit en
    Avril 2006
    Messages
    35
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Avril 2006
    Messages : 35
    Points : 21
    Points
    21
    Par défaut
    génial vous avez résolu mon problème :-)
    Merci beaucoup à tous les deux!

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 8
    Dernier message: 06/05/2007, 21h47
  2. Réponses: 4
    Dernier message: 01/02/2007, 19h06
  3. Réponses: 23
    Dernier message: 13/11/2006, 03h33
  4. Réponses: 5
    Dernier message: 26/07/2006, 11h13
  5. [debutant]fonction "split" avec une chaine comme m
    Par EpOnYmE187 dans le forum Débuter
    Réponses: 2
    Dernier message: 07/11/2005, 22h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo