IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

simpledom : pb pour parser site


Sujet :

Langage PHP

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    378
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 378
    Points : 94
    Points
    94
    Par défaut simpledom : pb pour parser site
    Bonjour,
    j'essaye de parser un site avec simple dom mais je n'arrive pas à accéder à la page.
    Dans un premier temps j'ai essayé directement avec simpledom mais il indiquait que la page avait bougé.
    en analysant un requete web, j'ai mis le navigateur que j'utilise et qui fonctionne.
    J'essaye de passer par curl pour ensuite utiliser simpledom

    L'objectif est d'arriver sur la page du formulaire de selection et valider.
    (je sais que cela bloquera aussi au niveau de valider car ce n'est pas un bouton submit) puis de parcourir toutes les pages pour ensuite copier les données du tableau

    voici le code
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
     
    <?php
     
    set_time_limit(0);
    date_default_timezone_set('Europe/Paris');
     
     
     
    include('../simple_html_dom.php');
     
    // Create DOM from URL or file
    //$html = file_get_html('http://www.nordpasdecalais.net/recherche/liste_resultats.aspx?type=i');
    $postfields = array();
    $url = "http://www.nordpasdecalais.net/recherche/liste_resultats.aspx?type=i";
    $useragent = "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4";
    $referer = "http://www.nordpasdecalais.net/achat_liste_entreprise.aspx";
     
    //Initialise une session CURL
    $ch = curl_init($url);
    curl_setopt($ch, CURLOPT_POST, 1);
    curl_setopt($ch, CURLOPT_POSTFIELDS, $postfields);
     
    curl_setopt($ch, CURLOPT_USERAGENT, $useragent);
    curl_setopt($ch, CURLOPT_REFERER, $referer);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
     
    $result = curl_exec($ch);
    curl_close($ch);
     
    echo $result;
    ?>
    Merci de l'avis des spécialistes et me dire si je ne suis pas dans le forum approprié

  2. #2
    Membre régulier
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    378
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 378
    Points : 94
    Points
    94
    Par défaut
    J'ai avancé en utilisant simplehtml dom.
    J'arrive sur la page où il y a le formulaire mais je ne sais pas comment cliquer pour ensuite récupérer la page

    pour valider il faut rechercher input type=image qui porte le nom wc_valider
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    <?php
     
    set_time_limit(0);
    date_default_timezone_set('Europe/Paris');
     
    include('../simple_html_dom.php');
    $postfields = array();
    $url = "http://www.nordpasdecalais.net/achat_liste_entreprise.aspx";
     
    $useragent = "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.94 Safari/537.4";
     
     
    $ch = curl_init($url);
     
    curl_setopt($ch, CURLOPT_USERAGENT, $useragent);
    chaine
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
    $result = curl_exec($ch);
    curl_close($ch);
    $html= str_get_html($result); 
    echo $html;
     
    $input= $html->find('#wc_formulaire input[type=image]', 0);
     
    echo $input;
     
     
    ?>

Discussions similaires

  1. Réponses: 2
    Dernier message: 14/06/2012, 14h19
  2. [fileupload] problème pour parser la requete
    Par jaimepasteevy dans le forum Struts 1
    Réponses: 12
    Dernier message: 24/04/2008, 12h02
  3. hote virtuel pour autre site web
    Par vedder dans le forum Apache
    Réponses: 8
    Dernier message: 27/07/2004, 14h25
  4. [ASP]pb pour un site bilingue
    Par DEC dans le forum ASP
    Réponses: 13
    Dernier message: 20/06/2004, 14h26

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo