Bonjour,
J'ai besoin des conseils de quelqu'un qui s'y connaît en indexation
Sur l'un de mes sites j'ai pas mal de fichiers PDF en ligne.
Plusieurs autres sites font des liens directs vers mes PDF, les visiteurs téléchargent donc les PDF sans passer par mon site.
J'ai donc voulu faire en sorte que lorsque l'on veut télécharger un PDF sur mon site on voie d'abord une page de téléchargement qui fournit un lien vers le PDF.
Ainsi les sites externes gardent la possibilité de faire des liens vers mes PDF, mais on voit quand même que c'est moi qui les héberge.
J'ai donc mis un .htaccess à la racine du site qui contient une redirection 301 :
Pour le reste, ça fonctionne comme suit :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 RedirectMatch 301 ^/(.+\.pdf)$ http://mon_site/download_page.php?filename=$1
download_page.php présente des informations relatives au fichier PDF (titre, auteur, brève description) + un lien vers download.php?filename=...
Il crée également une variable de session PHP indiquant que l'utilisateur a vu download_page.php pour ce fichier PDF.
download.php vérifie dans les variables de session PHP si l'utilisateur a vu download_page.php pour ce fichier PDF. Si tel est le cas il envoie le PDF demandé. Sinon il redirige vers download_page.php.
Voici ce qui se passe quand on veut télécharger un PDF :
- on charge l'adresse http://mon_site/pdf/un_fichier.pdf
- redirection .htaccess: http://mon_site/download_page.php?fi...un_fichier.pdf
- download.php affiche le nom de l'auteur, une description du fichier et un lien de téléchargement download.php?filename=un_fichier.pdf
- l'utilisateur clique sur le lien qui le dirige à l'adresse download.php?filename=un_fichier.pdf
- download.php voit que l'utilisateur a sa variable de session indiquant qu'il a vu la download_page.php, il envoie donc le PDF
Problème : Google et les autres moteurs de recherche n'indexent pas les PDF et leur contenu, et je ne comprends pas pourquoi.
Si vous avez des suggestions pour m'aider ça me serait très utile car je bloque un peu !
Peut être que c'est lié au fait que l'on soit obligé de visiter download_page.php avant de voir les PDF, et lorsque les moteurs ont indexé les PDF ils se rendraient compte plus tard que lorsqu'ils veulent à nouveau y accéder ils se retrouvent sur download_page.php avec un lien vers le PDF... peut être que ça les fait bugguer.
Si vous voulez tester en vrai sur le site au cas où je n'aurai pas été suffisamment clair : http://sitelec.org/cours2.htm, cette page est remplie de liens PDF (et aucun n'est indexé...).
Merci beaucoup pour vos lumières !
Partager