IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Trouver la présence d'un lien sur une page https avec file_get_contents


Sujet :

Langage PHP

  1. #1
    Membre actif
    Avatar de Freedolphin
    Homme Profil pro
    Webmaster
    Inscrit en
    Février 2006
    Messages
    291
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Webmaster
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Février 2006
    Messages : 291
    Points : 225
    Points
    225
    Par défaut Trouver la présence d'un lien sur une page https avec file_get_contents
    Bonjour,

    J'ai un petit bout de code qui me permet de savoir si un lien est bien placé dans une page dont je connais l'URL.
    J'ai remarqué que certaines pages https ne donne pas de résultat et j'ai lu que cela dépendait des serveurs, certains bloquant la fonction file_get_contents.
    Un autre essai avec @fopen m'indique également, dans ce cas, que l'URL est invalide.

    Voici mon code :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    $contents = file_get_contents($lien);
    $check = strpos($contents, $url);
    if ($check !== false) echo "OK";
    Connaissez-vous un moyen de contourner le problème, peut-être avec une autre fonction ?
    Merci de vos pistes et bonne journée.

  2. #2
    Membre actif Avatar de Trehinos
    Homme Profil pro
    Analyste développeur PHP
    Inscrit en
    Novembre 2012
    Messages
    100
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Analyste développeur PHP
    Secteur : Distribution

    Informations forums :
    Inscription : Novembre 2012
    Messages : 100
    Points : 232
    Points
    232
    Par défaut
    Bonjour,

    La bibliothèque cURL (https://www.php.net/manual/fr/book.curl.php) est la méthode standard pour une communication HTTP(S). Vous pourrez créer une requête HTTP et obtenir la même réponse du serveur qu'avec un navigateur web.
    Lisez bien la documentation, la bibliothèque n'est pas aussi simple d'utilisation que file_get_contents() mais le contrôle est beaucoup plus fin.

  3. #3
    Expert éminent Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 894
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 894
    Points : 6 648
    Points
    6 648
    Par défaut
    C'est probablement que le serveur vérifie le user agent et peut-être d'autres éléments du header qu'envoie un navigateur quand il demande une page. C'est faisable avec file_get_contents si tu lui passes en paramètre un contexte de flux:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    $opts = array(
      'http' => array('user_agent' => 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:66.0) Gecko/20100101 Firefox/66.0')
    );
     
    $context = stream_context_create($opts);
     
    $contents = file_get_contents($lien, false, $context);
    (Bien entendu tu peux mettre ce que bon te semble comme user agent.)

  4. #4
    Membre actif
    Avatar de Freedolphin
    Homme Profil pro
    Webmaster
    Inscrit en
    Février 2006
    Messages
    291
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Webmaster
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Février 2006
    Messages : 291
    Points : 225
    Points
    225
    Par défaut
    Merci pour vos réponses.
    Concernant Curl, j'ai fais un test avec curl_setopt et j'obtiens le même résultat (à savoir, parfois c'est bon, parfois c'est non valide).
    J'ai essayé le code de CosmoKnacki, c'est mieux, mais j'ai encore une erreur dans le lot d'URL traitées (ou plus exactement, un contenu non lu).

Discussions similaires

  1. [XL-2016] Vérifier la présence d'un lien sur une page web
    Par Yvan77 dans le forum Excel
    Réponses: 3
    Dernier message: 07/10/2017, 07h23
  2. Bloquer les liens sur une page
    Par dré kam dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 23/01/2012, 12h08
  3. différentes couleurs de liens sur une page
    Par Ninon30 dans le forum Dreamweaver
    Réponses: 1
    Dernier message: 01/10/2009, 15h51
  4. Réponses: 22
    Dernier message: 29/03/2007, 22h51

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo