Salut a tous,
Je bosse sur une extension firefox qui utilise de l'AJAX (XmlHttpRequest) pour obtenir une page web distante. J'aimerais pouvoir parcourir cette page web en tant que document DOM mais j'ai un probleme :
Certaines pages distantes sont mal formées (la structure XML n'est pas valide) ce qui produit une erreur si j'essaye de récupérer un document XML (var xmldoc = http_request.responseXML; ). Le script se bloque et n'étudie pas la suite du document.
J'ai cherché du coté des techniques AHAH (Async HTTP and HTML ?) qui consiste a ajouter le contenu de la requête (http_request.responseText) a l'aide de innerHTML, mais (évidemment !), le code ajouté est considéré comme du texte et n'est pas accessible avec le méthode de DOM (getElementById, ...). Cette technique aurait sans doute marché si je l'avais utilisée dans une page affichée dans le navigo mais je ne souhaite pas l'afficher, je souhaite un traitement en tache de fond.
Comment faire pour pouvoir charger une page HTML qui ne soit pas nécessairement bien formée (le navigateur le fait bien !) ?
Je précise que je ne veut pas afficher la page mais juste étudier son code et en extraire certaines données.
Merci d'avance.
Partager