Bonjour,

Je développe actuellement un outil d’analyse de site web (aide à la SEO).
Cet outil doit donc récupérer certaines informations d’un site avant de les analyser.
Je rencontre donc quelques difficultés pour récupérer certaines de ces informations.
(J’ai pas mal fouillé pour trouver des réponses mais je n’ai rien trouvé de vraiment pertinent)

- Le nombre de pages indexées par google
C’est la commande site:www.monsite.com sur google qui donne le nombre de résultat du moteur de recherche qui pointe vers le site en question.

- URL du site propres (rewriting)
Là c’est peut être un manque de connaissance de ma part, si j’ai bien compris cette règle est appliqué dans le htaccess (qui est inaccessible).
Un test sémantique de plusieurs url du domaine suffirait sans doute à savoir si les url sont propres ?

- La personnalisation des pages 404
Là je peux tester une page dont je sais qu'elle me renverra une erreur 404 et l’analyser pour voir si le message 404-Not found apparais mais ça ressemble plutôt à de la bidouille.

Voilà si vous avez une petite idée même incomplète n'hésitez pas