IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Dotnet Discussion :

Extraire des données d'un site sans passer par une API


Sujet :

Dotnet

  1. #1
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2014
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2014
    Messages : 5
    Points : 3
    Points
    3
    Par défaut Extraire des données d'un site sans passer par une API
    Bonjour,


    Je souhaite extraire des données d'un site (des infos qu'on peut directement voir sur le site mais que j'aimerai obtenir automatiquement sous forme numérique car elle change sans arrêt) sans passer par une API (qui n'existe pas pour ce site).

    Cordialement

    Addon

    p.s: je ne souhaite rien faire d'illegal simplement trouver un moyen de réordonner ces infos grâce à un logiciel.

  2. #2
    Rédacteur
    Avatar de The_badger_man
    Profil pro
    Développeur .NET
    Inscrit en
    Janvier 2005
    Messages
    2 745
    Détails du profil
    Informations personnelles :
    Âge : 40
    Localisation : France, Yvelines (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET

    Informations forums :
    Inscription : Janvier 2005
    Messages : 2 745
    Points : 8 538
    Points
    8 538
    Par défaut
    Si le site ne propose pas d'API permettant de récupérer cette information, à part récupérer le code html de la page et chercher "à la main" l'information à l'intérieur, il n'y pas vraiment d'autre solution.

  3. #3
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2014
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2014
    Messages : 5
    Points : 3
    Points
    3
    Par défaut
    Ok merci pour ta réponse, je vais me mettre au php je pense...

  4. #4
    Rédacteur/Modérateur


    Homme Profil pro
    Développeur .NET
    Inscrit en
    Février 2004
    Messages
    19 875
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Développeur .NET
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Février 2004
    Messages : 19 875
    Points : 39 753
    Points
    39 753
    Par défaut
    Tu peux utiliser HTML Agility Pack pour extraire les données
    http://tlevesque.developpez.com/tuto...-agility-pack/

    Citation Envoyé par Addon75 Voir le message
    Ok merci pour ta réponse, je vais me mettre au php je pense...
    Pourquoi PHP ? Tu peux aussi bien le faire en .NET...

  5. #5
    Membre expert
    Avatar de GuruuMeditation
    Homme Profil pro
    .Net Architect
    Inscrit en
    Octobre 2010
    Messages
    1 705
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : Belgique

    Informations professionnelles :
    Activité : .Net Architect
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2010
    Messages : 1 705
    Points : 3 570
    Points
    3 570
    Par défaut
    Je plussoie, le HTML Agility pack est très bien pour le parsing de pages

  6. #6
    Membre expert
    Avatar de Pragmateek
    Homme Profil pro
    Formateur expert .Net/C#
    Inscrit en
    Mars 2006
    Messages
    2 635
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Formateur expert .Net/C#
    Secteur : Conseil

    Informations forums :
    Inscription : Mars 2006
    Messages : 2 635
    Points : 3 958
    Points
    3 958
    Par défaut
    Je confirme : HTML Agility Pack est très permissif et peut gérer les documents les plus mal foutus.
    Moins connu malheureusement mais très puissant tu as XPath pour la recherche du contenu.
    HTML Agility Pack + XPath est l'équation gagnante pour ce type de besoin.

Discussions similaires

  1. [XL-2010] Extraire des données d'un classeur sans l'ouvrir
    Par sirine_ dans le forum Macros et VBA Excel
    Réponses: 6
    Dernier message: 12/10/2014, 19h48
  2. Réponses: 3
    Dernier message: 02/05/2014, 11h47
  3. Réponses: 0
    Dernier message: 11/07/2012, 18h24
  4. Réponses: 3
    Dernier message: 06/06/2008, 16h54
  5. Réponses: 2
    Dernier message: 19/04/2006, 13h43

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo