bonjour,
voilà, je souhaite créer un outil de calcul de densité de mots clés sur une page web en php.
je parviens à afficher les mots trouvés dans la page web sans les balises grace à la fonction strip_tags (pour zapper les balises) et file_get_contents (pour parser le contenu de la page en question), mais le hic, c'est que ce code m'affiche aussi le contenu des scripts en javascript contenus dans le body.
il doit y avoir un moyen de sélectionner le texte contenu entre les balises script et /script et de le remplacer par une chaine de caracteres nule , mais je n'arrive pas à trouver et je ne connais pas la fonction php qui permet cela.
voici mon code :
merci de votre aide,
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11 <?php $chaine=strtolower(strip_tags(file_get_contents("http://www.referencement-creation.com/"))); $tout= str_word_count ($chaine); $total[0]=array_unique((str_word_count ($chaine,1, 'éèçàäâù'))); foreach ($total[0] as $expression) { $occurence=substr_count($chaine, $expression); $densite= ($occurence*100/$tout); if ($densite>0.1 && strlen($expression)>5){echo "$expression => $densite %<br>";} } ?>
cordialement,
christophe.
Partager