IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langages de programmation Discussion :

Crawler web : quel langage, script ?


Sujet :

Langages de programmation

  1. #1
    Nouveau Candidat au Club
    Profil pro
    Inscrit en
    Août 2012
    Messages
    1
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2012
    Messages : 1
    Points : 1
    Points
    1
    Par défaut Crawler web : quel langage, script ?
    Bonjour,

    Je souhaite mettre en place, pour un projet un crawler web.
    Le but de ce projet n'est pas de concurrencer google loin de là ma plutôt de référencer les pages de plusieurs sites universitaire.

    Tout d'abord, vers quel langage me tourner ?
    En php, pas de multi thread donc j'ai abandonné.
    Java ou python ? Quel est le mieux pour vous ??
    Pourquoi pas en C si j'ai accès aux sources.

    En effet, il existe des web crawler open source sur le web mais je souhaite qu'ils soient modulable pour s'adapter à mes besoins.

    Je précise que mes connaissances sont limités en programmation (mise à part en Php). Et donc je cherche un mix pour permettre souplesse, efficacité et pouvoir avoir l'aide de la communauté (même si je pense faire appel à un freelancer).

    Le programme devra en outre permettre :
    - de crawler les pages d'un site pour x niveau de profondeur
    - crawler les pages internes et externes
    - récupérer les balises
    - indiquer les contenu n'existant plus ou bad request pour ne pas les inclure dans l'index
    et toutes les fonctions de base

    Merci d'avance de vos réponses.

  2. #2
    Expert éminent
    Avatar de Melem
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Janvier 2006
    Messages
    3 656
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Électronique et micro-électronique

    Informations forums :
    Inscription : Janvier 2006
    Messages : 3 656
    Points : 8 389
    Points
    8 389
    Par défaut
    Pour cela, il te faudra une bibliothèque permettant de demander un document à un serveur, et une bibliothèque permettant de parser le HTML. Je pense que tous les langages son bons candidats pour ça. Néanmoins, les langages de scripting plus ou moins orientés web le feront mieux, naturellement. En gros du Perl ou du Python, etc. avec une préférence personnelle pour Python.

  3. #3
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 357
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 357
    Points : 36 886
    Points
    36 886
    Par défaut
    Salut,

    Citation Envoyé par lillois59 Voir le message
    En effet, il existe des web crawler open source sur le web mais je souhaite qu'ils soient modulable pour s'adapter à mes besoins.

    Je précise que mes connaissances sont limités en programmation (mise à part en Php). Et donc je cherche un mix pour permettre souplesse, efficacité et pouvoir avoir l'aide de la communauté (même si je pense faire appel à un freelancer)
    Il faudrait détailler plus les fonctionnalités attendues dans le temps.
    Regarder ce que font déjà les frameworks existants: si la fonctionnalité existe est elle simple à mettre en œuvre sinon comment étendre l'existant?

    Si vous ne programmez pas, le bon "framework"/"langage" risque d'être contraint par ceux que maitrisent les freelances que vous pourrez vous offrir.

    Jetez un oeil a scrapy, c'est un framework Python. Il est probablement surdimensionné par rapport à vos besoins.
    En balayant la documentation vous allez peut être pouvoir mieux cerner ce que vous voulez ou pas côté fonctionnalités/réalisation.
    - W


    vous devrez "configurer", pouvoir "modifier" un certain nombre d'objets plus ou moins facilement...

Discussions similaires

  1. Formation ET Développement WEB : Quels langages ?
    Par DreamNooby dans le forum Général Conception Web
    Réponses: 6
    Dernier message: 06/06/2012, 15h23
  2. Site web, quels langages choisir ?
    Par mikees dans le forum Général Conception Web
    Réponses: 8
    Dernier message: 24/03/2010, 10h26
  3. Développement appli Web : quel langage ?
    Par Slam7 dans le forum Débuter
    Réponses: 4
    Dernier message: 01/02/2010, 13h59
  4. Envoi de photos gsm vers le web : quel langage ?
    Par dojoman dans le forum Langages de programmation
    Réponses: 2
    Dernier message: 22/05/2007, 20h27
  5. Jeux web : quel langage ?
    Par Rémiz dans le forum Général Conception Web
    Réponses: 4
    Dernier message: 16/08/2005, 16h50

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo