Bonjour,
J'ai un fichier HTML à ouvrir, et à faire quelques opérations dessus.
Donc pour l'ouvrir je fais ceci :
$fichier = file_get_contents("MonFichier.html");
Ensuite, je dois stocker dans un tableau ($Tab) toutes les URL des liens hypertextes de la page, donc que l'on peut identifier par href="...".
J'ai donc fait ceci :
1 2 3
|
preg_match_all('#(href=")(.*)(")#isU', $fichuer, $Tab );
print_r($Tab[2]); |
Je pense que ça doit être bon, mais pour les afficher, comment faire pour qu'il y ait une URL par ligne ? J'ai essayé avec un foreach(...) mais ça ne marche pas, ou alors je l'avais mal fait.
Ensuite à partir du tableau $Tab, il faut que j'affiche les différents sites web, donc ce qui est compris entre http:// et le 3ème /.
Par exemple si on a ça : https://twitter.com/official_php, je voudrais que ça me sorte ceci : twitter.com
C'est surtout là que je bloque. J'avais tenté ceci, mais sans réussite :
1 2 3 4 5 6
|
foreach($Tab as $SiteWeb)
{
preg_match('#(http://)(.*)(/)#',$SiteWeb[2],$Lien);
print_r($Lien);
} |
Pourriez-vous m'aider ?
Merci d'avance.
Partager