IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Aspirer une page complète


Sujet :

Langage PHP

  1. #1
    Membre averti Avatar de sami_c
    Profil pro
    Chef de projet
    Inscrit en
    Mai 2002
    Messages
    756
    Détails du profil
    Informations personnelles :
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Chef de projet

    Informations forums :
    Inscription : Mai 2002
    Messages : 756
    Points : 402
    Points
    402
    Par défaut Aspirer une page complète
    Bonjour,
    Je voudrais créer un script php qui permet d'aspirer une PAGE (et non pas un site) avec toutes ses images.
    Merci

  2. #2
    Expert éminent Avatar de Mr N.
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    5 418
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 5 418
    Points : 6 449
    Points
    6 449
    Par défaut
    commence déjà par par récupérer une page sans images
    file, fopen, file_get_contents, sockets, curl, ...

  3. #3
    Membre averti Avatar de sami_c
    Profil pro
    Chef de projet
    Inscrit en
    Mai 2002
    Messages
    756
    Détails du profil
    Informations personnelles :
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Chef de projet

    Informations forums :
    Inscription : Mai 2002
    Messages : 756
    Points : 402
    Points
    402
    Par défaut
    c'est fait, avec fopen et fgets
    ensuite c'est la récup des fichiers qui me préoccupe, je pense qu'il faudrait utilise les expressions régulière...que est pour moi un casse tête

  4. #4
    Expert éminent Avatar de Mr N.
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    5 418
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 5 418
    Points : 6 449
    Points
    6 449
    Par défaut
    preg_match_all, après etre faire un tour là dessus =>
    http://www.expreg.com

    Il te reste plus qu'à capturer les images (relatives !) qui sont dans img src="XXX", + d'autres comme dans les feuilles de styles

  5. #5
    Membre éclairé
    Avatar de Kioob
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    550
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Septembre 2004
    Messages : 550
    Points : 764
    Points
    764
    Par défaut
    et pourquoi donc "aspirer" une page ?

    Je rappel en passant que le vol de contenu, c'est mal (tm).

    S'il s'agit d'un truc réellement fait pour (news par exemple), vaut mieux demander un flux XML : ça évitera de foutre à terre le serveur visé...

  6. #6
    Membre averti Avatar de sami_c
    Profil pro
    Chef de projet
    Inscrit en
    Mai 2002
    Messages
    756
    Détails du profil
    Informations personnelles :
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Chef de projet

    Informations forums :
    Inscription : Mai 2002
    Messages : 756
    Points : 402
    Points
    402
    Par défaut
    ce n'est pas pour le vol, en fait là je suis dans un pays qui censure des sites, alors je crée un aspirateur que je vais heberger sur un hebergeur non censuré et qui me permettra de récupérer les pages censurée...c'est donc pour une bonne cause

  7. #7
    Membre éclairé
    Avatar de Kioob
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    550
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Septembre 2004
    Messages : 550
    Points : 764
    Points
    764
    Par défaut
    Dans ce cas c'est un proxy que tu dois mettre en place...

  8. #8
    Membre averti Avatar de sami_c
    Profil pro
    Chef de projet
    Inscrit en
    Mai 2002
    Messages
    756
    Détails du profil
    Informations personnelles :
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Chef de projet

    Informations forums :
    Inscription : Mai 2002
    Messages : 756
    Points : 402
    Points
    402
    Par défaut
    les proxy seront détecté et censuré eux aussi ...

  9. #9
    Rédacteur
    Avatar de marcha
    Homme Profil pro
    Développeur Web
    Inscrit en
    Décembre 2003
    Messages
    1 571
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : Suisse

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Décembre 2003
    Messages : 1 571
    Points : 2 351
    Points
    2 351
    Par défaut
    Test avec ça si tu peux récupérer les urls des images

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    	function getUrls($string, $strict=true) {
    		$types = array("href", "src", "url");
    		while(list(,$type) = each($types)) {
    			$innerT = $strict?'[a-z0-9:?=&@/._-]+?':'.+?';
    			preg_match_all ("|$type\=([\"'`])(".$innerT.")\\1|i", $string, &$matches);
    			$ret[$type] = $matches[2];
    		}	
    		return $ret;
    	}

Discussions similaires

  1. Aspirer une page PHP
    Par ProgVal dans le forum Langage
    Réponses: 8
    Dernier message: 01/05/2008, 12h46
  2. formulalocal pour une page complète ?
    Par melodyyy dans le forum Macros et VBA Excel
    Réponses: 11
    Dernier message: 11/11/2007, 17h11
  3. Réponses: 6
    Dernier message: 05/07/2006, 17h13
  4. Une image sur une page complète
    Par progfou dans le forum Tableaux - Graphiques - Images - Flottants
    Réponses: 6
    Dernier message: 27/04/2006, 17h18
  5. [HTML]Affichage d'une page complète dans une cadre.
    Par cach dans le forum Balisage (X)HTML et validation W3C
    Réponses: 2
    Dernier message: 28/02/2006, 18h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo