Bonjour, je cherche à parser un fichier XML contenant des accents. J'éprouve des problèmes d'encodage et je trouve assez difficilement des informations sur le net. J'utilise pour le moment minidom pour parser un fichier encodé en ISO-8859-1. Voici mon code:
Et voici le code d'erreur:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 try: fileXML = open(fichierXML, 'r+') fileXML = fileXML.read() fileXML = u'%s'.encode(fichierEncodXML)%fileXML except IOError, message: print >> sys.stderr, 'File could not be opened:', message raw_input( '\nAppuyer sur une touche...' ) sys.exit( 1 ) document = xml.dom.minidom.parseString(fileXML) #on parse le document
J'ai déjà essayé pas mal de combinaisons avec les fonctions encode et decode mais rien ne fonctionne :s Quelqu'un pourrait-il m'aider svp?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12 Traceback (most recent call last): File "profils.py", line 45, in <module> document = xml.dom.minidom.parseString(fileXML) #on parse le document File "C:\Python25\lib\xml\dom\minidom.py", line 1923, in parseString return expatbuilder.parseString(string) File "C:\Python25\lib\xml\dom\expatbuilder.py", line 940, in parseString return builder.parseString(string) File "C:\Python25\lib\xml\dom\expatbuilder.py", line 223, in parseString parser.Parse(string.decode('ISO-8859-1'), True) UnicodeEncodeError: 'ascii' codec can't encode characters in position 62-63: ord inal not in range(128)
Merci beaucoup!!
Partager