Bonjour,
Voila j'utilise le module HTML::Parser pour extraire les informations de certain site, notament lemonde.fr...
Mon problème est que sur le site lemonde.fr la 1er lettre de chaque article est une image de la lettre. Il m'est donc impossible de la récupérer avec le module HTML::Parser qui supprime toutes les balises html qu'il croise
ex :
http://www.lemonde.fr/web/article/0,...-965349,0.html
(voir le A)
J'aimerais pouvoir récuperer cette image ou au moins son titre qui correspond à la lettre que l'image remplace, ce qui me suffirait pour completer l'article que je stock ...
En d'autre mot, dans l'article : l'image est : A.gif, j'aimerais pouvoir en extraire le A)
Avez vous une petite idée ?
j'ai entendu parler de perfectCR qqun l'a deja utilisé ?
Partager