conversion UNICODE -> ASCII

**juniorAl** · 27/04/2010, 18h59

Bonjour,
je dois réaliser une classe de récupération de divers fichiers textes de formats différents (CSV, txt, etc.) ... et surtout de pays différents (Europe Ouest / Latin), Grec, Cyrillique, etc. (Supplement 1, Extended A, Extended B, etc)

J'envisageais donc de commencer par convertir les strings issues des fichiers reçus dont je ne connais pas à priori le codage lors de la réception en UNICODE en utilisant quelque chose du genre :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
 
                Encoding srcEnc= Encoding.???;
                Encoding dstEnc= Encoding.Unicode;
                byte[] inter = Encoding.Convert(srcEnc, dstEnc, MyString);

Mais justement, il faut connaître le codage source ???? comment faire alors ?

Si par contre je fais un :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
 
                System.Text.Encoding enc = System.Text.Encoding.UTF8;
                string ToString = enc.GetString(MyString);

je récupère biens tous les caractères, mais les caractères non-ASCII ne sont malgré tout pas traduits... ???

Est-ce que la solution est de parcourir les string et de remplacer caractère par caractère "en "ce qu'on attend" ? Ce serait étonnant... je dois rater quelque chose !

ma chaine de test est :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
 
private byte[] Nam = new byte[] { (byte)'\u00c5', (byte)'\u00c4', (byte)'\u00c6', (byte)'\u00cf', (byte)'\u0020', (byte)'\u0048', (byte)'\u0045'};

avec la solution 2, j'obtiens : "�� HET" ???

Merci.

**juniorAl** · 27/04/2010, 19h17

il suffit d'utiliser l'UTF7 et ça fonctionne !

**juniorAl** · 19/05/2010, 12h00

J'étais allé un peu vite dans mon raisonnement !
en fait non ça ne fonctionne pas...

Comment faire pour récupérer un texte codé en Cyrillique par exemple :
caractères de \u0050-\u0525, \u2DE0-\u2DFF (Ext-A), \uA640-\uA697(Ext.B).

Ou plus simplement comment afficher le Pi (\u03a0) par exemple ?

L'exemple donné par MSDN ici ne fonctionnent pas !
http://msdn.microsoft.com/fr-fr/libr....encoding.aspx
car il donne le résultat suivant dans la console :

Original string: This string contains the unicode character Pi(?)

Ascii converted string: This string contains the unicode character Pi(?)

En même temps en passant par un byte[] dans le code ça ne m'étonne pas vraiment ! puisque les bytes sont limités à 7F sauf erreur de ma part...

Mais comment faire, car les Encoding ne laisse pas d'autre choix que de passer un paramètre byte[] dans tous les Getxxx, y compris pour le GetChars ?

Merci d'avance pour votre aide....

**juniorAl** · 19/05/2010, 14h55

J'ai essayé plus simplement avec :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
 
[DllImport("kernel32.dll", SetLastError = true)]
internal static extern bool SetConsoleCP(uint codePage);
 
string unicodeString = "This string contains the unicode character Pi(\u03a0)";
SetConsoleCP((uint)65000);
Console.WriteLine("Ascii converted string: {0}", unicodeString);

J'ai essayé avec diverses valeurs d'uint extraite de :
http://msdn.microsoft.com/en-us/libr...(v=VS.85).aspx

et bien le résultat est toujours :

Ascii converted string: This string contains the unicode character Pi(?)

**juniorAl** · 19/05/2010, 15h16

après de nombreuses recherches sur le Web.
Il semble que la Console soit la fautive.

Les bytes sont bien rangé dans le byte[] dans un ordre pf, PF qui permet de ne rien perdre du codage unicode.
J'ai contrôlé sur unicodeBytes :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

byte[] unicodeBytes = unicode.GetBytes(unicodeString);

**Graffito** · 19/05/2010, 23h09

je récupère biens tous les caractères, mais les caractères non-ASCII ne sont malgré tout pas traduits... ???

Pour texte DOS:

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
StreamReader sr = new StreamReader("monFichier.txt",
   Encoding.GetEncoding("iso-8859-1")) ;

conversion UNICODE -> ASCII

C#

Discussions similaires

Partager

Partager