Re-coucou,

Voici une règle de XML qui peut être assez déroutante :

Citation Envoyé par W3C REC XML11
match
[Definition: (Of strings or names Two strings or names being compared are identical. Characters with multiple possible representations in Unicode (e.g. characters with both precomposed and base+diacritic forms) match only if they have the same representation in both strings. No case folding is performed. (Of strings and rules in the grammar A string matches a grammatical production if it belongs to the language generated by that production. (Of content and content models An element matches its declaration when it conforms in the fashion described in the constraint [VC: Element Valid].]
« the same representation » : et donc comme deux représentations différentes peuvent correspondrent à une seule et même lecture par un humain, il s'en suite que ce qui est identique aux yeux d'un humain, peut être différent au yeux d'un processeur XML.

Comment y remédier ?

Il y a la possibilité d'éditer avec un éditeur qui n'affiche que les représentation des caractères, sans appliquer les ligatures ni les compositions, mais je ne vous raconte pas la fête avec des langues telles que l'Arabe ou le Tibétain (de tels éditeurs existent). Le mieux je pense est donc d'imposer une règle préalable pour les représentations, et de n'employer par exemple des éditeurs qui n'enregistre que sous les formes canoniques (voir le site Unicode au sujet des représentations canoniques).

Bonne soirée