IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C Discussion :

Conversion iso-utf8 : longueur de chaîne


Sujet :

C

  1. #1
    Candidat au Club
    Profil pro
    Inscrit en
    Décembre 2004
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2004
    Messages : 2
    Points : 2
    Points
    2
    Par défaut Conversion iso-utf8 : longueur de chaîne
    Bonjour !

    J'ai écrit une fonction qui convertit une chaîne de iso 8859-1 vers utf-8.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    int iso88591ToUtf8(const char * capSrc, int iSrcLen, char * capDest) {
    	int iUtfLen=0;
    	int i;
     
    	for(i = 0 ; i<iSrcLen ; i++){
     
    		if(capSrc[i] < 0) {
    			capDest[iUtfLen] = 0xc0 | ((capSrc[i] >> 6) & 0x03);
    			//printf("%x\n", capDest[iUtfLen]);
    			iUtfLen++;
    			capDest[iUtfLen] = 0x80 | (capSrc[i] & 0x3f);
    			//printf("%x\n", capDest[iUtfLen]);
    			iUtfLen++;
    		}else{
    			capDest[iUtfLen] = capSrc[i];
    			//printf("%c", capDest[iUtfLen]);
    			iUtfLen++;
    		}
    	}
     
    	capDest[iUtfLen] = '\0';
     
    	return iUtfLen;
    }
    Mais j'ai un gros problème de longueur de chaîne.

    Par exemple si je rentre une chaîne qui ne sera pas modifié (tous les caractères passe dans le "else"), et que j'affiche les caractères un par un avec le printf commenté, pas de problème, j'ai l'exacte copie de la chaîne entrante.
    Mais si j'affiche la chaîne capDest après être sorti de la fonction, ca me fait des trucs bizarre.

    Par exemple pour "C:\Documents and Settings\User\Bureau\truc", j'obtiens quelque chose comme "C:\Documents and Settings\User\Bureau\trucd" et c'est aléatoire selon les chaînes, il peut y avoir plusieurs caractères en trop, et des caractères bizarre aussi.
    Si j'utilise le printf("%c", capDest[iUtfLen]) dans la fonction pas de problème.

    Bref je ne comprends pas pourquoi ca marche très bien caractère à caractère et pas avec une chaîne.

    Merci d'avance pour vos réponses.

  2. #2
    Expert éminent sénior
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 379
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 379
    Points : 41 572
    Points
    41 572
    Par défaut
    Le buffer capDest est assez grand pour tout accueillir?
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

  3. #3
    Expert éminent

    Inscrit en
    Novembre 2005
    Messages
    5 145
    Détails du profil
    Informations forums :
    Inscription : Novembre 2005
    Messages : 5 145
    Points : 6 911
    Points
    6 911
    Par défaut
    Tu utilises bien la valeur de retour comme étant un nombre de byte et pas un nombre de caractères? Tu n'utiliserais pas des api qui suppose que la chaîne se termine pas un \0?
    Les MP ne sont pas là pour les questions techniques, les forums sont là pour ça.

  4. #4
    Membre chevronné
    Homme Profil pro
    Dév. Java & C#
    Inscrit en
    Octobre 2002
    Messages
    1 414
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Dév. Java & C#
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Octobre 2002
    Messages : 1 414
    Points : 1 996
    Points
    1 996
    Par défaut
    Bonjour,

    Ne faut-il pas ajouter un '\0' à la fin de ta chaîne UTF-8?

    Quelle fonction utilises-tu pour afficher ta chaîne UTF-8?
    Bien le bonjour chez vous
    Jowo

  5. #5
    Candidat au Club
    Profil pro
    Inscrit en
    Décembre 2004
    Messages
    2
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2004
    Messages : 2
    Points : 2
    Points
    2
    Par défaut
    Merci beaucoup !!!

    C'était effectivement le '\0'....

    Je corrige le code histoire qu'il puisse servir à d'autre.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Delphi 5] conversion ISO --> UTF8
    Par Eylir dans le forum Langage
    Réponses: 4
    Dernier message: 22/09/2009, 16h27
  2. conversion iso -> utf
    Par troumad dans le forum C
    Réponses: 6
    Dernier message: 20/04/2007, 16h52
  3. Réponses: 1
    Dernier message: 05/12/2006, 16h54
  4. conversion iso-8859-1 vers utf-8
    Par gorgonite dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 20/08/2006, 12h49
  5. conversion iso-8859-1 => UTF-8 (unicode)
    Par pierru666 dans le forum Général JavaScript
    Réponses: 5
    Dernier message: 30/05/2006, 22h17

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo