Bonjour, je dois extraire de l'information de lignes qui ressemblent à ça :
<DT><A HREF="http://www.google.fr/" ADD_DATE="1261570080" LAST_MODIFIED="1261570080" ICON_URI="http://www.google.fr/favicon.ico" ICON="data:image/png;base64,iVBORwoAAf8/9hAAg==" LAST_CHARSET="UTF-8">Titre de la page</A>
Il me faut HREF, l'Ancre (Titre du lien) ainsi que la date ADD_DATE. Voici les expressions que j'utilise :
1 2 3 4 5
| <?php
$this->title = ereg_replace ("^( *<DT><[^>]*>)([^<]*)(.*)", "\\2", $line);
$this->url = ereg_replace ("([^H]*HREF=\")([^\"]*)(\".*)", "\\2", $line);
$this->date = ereg_replace ("([^A]*ADD_DATE=\")([^\"]*)(\".*)", "\\2", $line);
?> |
Title et url marchent bien, par contre date foire.
Ça me retourne <DT><A1261570080 quand l'attribut ADD_DATE existe, et la ligne entière si l'attribut n'existe pas.
Comment faire pour que ça fonctionne ?
Merci
Partager