Bonjour,
Je cherche à récupérer tous les liens (href et les titres ) d’un texte HTML
Pour faire ça j’ai un regex :
qui me permet de récupérer tous les liens et leur titres:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 preg_match_all('/<a.*?(?: |\\t|\\r|\\n)?href=[\'"]?(.+?)[\'"]?(?:(?: |\\t|\\r|\\n)+.*?)?>(.+?)<\/a.*?>/sim', $page, $match, PREG_SET_ORDER);
ex : <a href="monsite.htm">Monsite</a>
J’obtiens monsite.htm et Monsite
Ma question c’est lorsque j’ai une balise de cette forme :
<a href="monsite.htm"><img src=”images/logos” alt=”Monsite”></a>
Comment je peux récupérer la valeur de l’attribut alt (Monsite).
Avec mon regex j’arrive à récupérer monsite.htm mais pour le titre il m’affiche l’image.
Comment je peux récupérer que le titre de l’image ?
Merci.
Partager