IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Bibliothèques et frameworks PHP Discussion :

[DOM] Analyse XML et encodage UTF-8


Sujet :

Bibliothèques et frameworks PHP

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Février 2009
    Messages
    330
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2009
    Messages : 330
    Points : 93
    Points
    93
    Par défaut [DOM] Analyse XML et encodage UTF-8
    Bonjour,

    J'utilise le xml parser pour parser un xml et le retranscrire en HTMl.

    Cependant, j'ai un soucis au niveau de l'encodage en utf8. ma sortie HTML ne délivre pas de l'utf8.

    voici mon script php:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
     
    $file = "xml/phrase.xml";
     
    //echo $file."\n";
    global $inTag;
    $inTag = "";
     
    $xml_parser = xml_parser_create();
     
    xml_parser_set_option($xml_parser, XML_OPTION_CASE_FOLDING, 0);
    xml_parser_set_option($xml_parser, XML_OPTION_SKIP_WHITE, 1);
     
    xml_set_processing_instruction_handler($xml_parser, "pi_handler");
    xml_set_default_handler($xml_parser, "parseDEFAULT");
    xml_set_element_handler($xml_parser, "startElement", "endElement");
    xml_set_character_data_handler($xml_parser, "contents");
     
     
     
    if (!($fp = fopen($file, "r"))) {
    	if (!xml_parse($xml_parser, $data, feof($fp))) {
    		die( sprintf("XML error: %s at line %d",
    		xml_error_string(xml_get_error_code($xml_parser)),
    		xml_get_current_line_number($xml_parser)));
    	}
    }
    while ($data = fread($fp, 4096)) {
    	if (!xml_parse($xml_parser, $data, feof($fp))) {
    		die( sprintf("XML error: %s at line %d",
    		xml_error_string(xml_get_error_code($xml_parser)),
    		xml_get_current_line_number($xml_parser)));
    	}
    }
    xml_parser_free($xml_parser);
     
    function startElement($parser, $name, $attrs) {
     
    	global $inTag;
    	global $depth;
     
    	$padTag = str_repeat(str_pad(" ", 3), $depth);
     
    	if (!($inTag == "")) {
    		echo ">";
    	}
    	// ouverture tag span pour word
    	$span ="span";
    	echo "\n$padTag<$span";
    	foreach ($attrs as $key => $value) {
    		echo "\n$padTag".str_pad(" ", 3);
    		//impression des attributs
    		if($key=="function"){
    			$key="class"; echo " $key=\"$value\"";
    		}
    		else if($key=="type"){$key="class"; $key2="title"; echo " $key=\"$value\" $key2=\"$value\"";}
    		else if($key=="xml:lang"){}
    		//else if($key=="n"){}
    		else {}
    		//echo " $key=\"$value\"";
    	}
    	$inTag = $name;
    	$depth++;
    }
     
    function endElement($parser, $name) {
     
    	global $depth;
    	global $inTag;
    	global $closeTag;
     
    	$depth--;
     
    	if ($closeTag == TRUE) {
    		// fermeture tag span pour word
    		$span ="span";
    		echo "</$span>";
    		$inTag = "";
    	} elseif ($inTag == $name) {
    		echo " />";
    		$inTag = "";
    	} else {
    		$padTag = str_repeat(str_pad(" ", 3), $depth);
    		//----- fermeture tag span pour phr -----//
    		$span ="span";
    		echo "\n$padTag</$span>";
    	}
    }
     
    function contents($parser, $data) {
     
    	global $closeTag;
     
    	$data = preg_replace("/^\s+/", "", $data);
    	$data = preg_replace("/\s+$/", "", $data);
     
    	if (!($data == ""))  {
    		echo ">$data";
    		$closeTag = TRUE;
    	} else {
    		$closeTag = FALSE;
    	}
    }
     
    function parseDEFAULT($parser, $data) {
     
    	$data = preg_replace("/</", "<", $data);
    	$data = preg_replace("/>/", ">", $data);
    	echo $data;
    }
     
    function pi_handler($parser, $target, $data) {
     
    	echo "<?$target $data?>\n";
    }
    j'ai tenté l'option :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    xml_parser_set_option($xml_parser, XML_OPTION_TARGET_ENCODING,
    "utf-8");
    mais rien n'y fait.

    merci

  2. #2
    Membre régulier
    Profil pro
    Inscrit en
    Février 2009
    Messages
    330
    Détails du profil
    Informations personnelles :
    Localisation : France, Paris (Île de France)

    Informations forums :
    Inscription : Février 2009
    Messages : 330
    Points : 93
    Points
    93
    Par défaut
    Je crois savoir que l'encodage n'est pas vraiment le soucis.
    en fait, mon script doit lire chaque caractere un par un. le soucis est que lorsqu'il rencontre un caractere accentuer il y a un probleme puisqu'il ne sait pas comment le traiter.

Discussions similaires

  1. [JAXP] Parsing XML avec encodage UTF-8
    Par mixi dans le forum Format d'échange (XML, JSON...)
    Réponses: 1
    Dernier message: 13/12/2008, 15h00
  2. [DOM] Analyser un fichier XML en PHP
    Par wehtam dans le forum Bibliothèques et frameworks
    Réponses: 1
    Dernier message: 06/03/2008, 18h52
  3. [DOM] Analyser du XML ayant une structure inconnue
    Par bdaboah dans le forum Bibliothèques et frameworks
    Réponses: 5
    Dernier message: 28/01/2008, 14h17
  4. [DOM] Analyse XML - plusieurs fois la même balise ?
    Par unfamous dans le forum Bibliothèques et frameworks
    Réponses: 5
    Dernier message: 03/09/2007, 01h09
  5. [DOM] Encodage UTF-8 dans fichier XML et PHP
    Par norkius dans le forum Bibliothèques et frameworks
    Réponses: 7
    Dernier message: 03/01/2007, 15h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo