IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Java Discussion :

developpement application (parseur html, download)


Sujet :

Langage Java

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Février 2007
    Messages
    186
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2007
    Messages : 186
    Points : 71
    Points
    71
    Par défaut developpement application (parseur html, download)
    Bonjour, récemment j'ai développer une min-appli web en php, dont le but et de parser un site web (lecture du code source), d'en retirer les liens portant sur des fichier avec une extension donnée (<a href= "www.blabla.fr/fichier.ext"/>)
    et ensuite de le télécharger (puis stocker les liens en bdd).

    Elle marche correctement cependant, je n'ai pas envie de l'utiliser sur le web, je souhaite la faire marcher en local, pour l'instant j'utilise apache.

    La raison pour laquelle je m'adresse dans cette partie du forum, est que mêm si ça marche, ce n'est pas vraiment très puissant (parsing, dl, création de repertoire...).
    Donc je voudrais savoir si c'est possible de réaliser la même chose en java(ou sinon un langage plus approprié), et surtout si vous pensez que l'appli serait plus puissante.

    Merci de vos réponse je suis ouvert à tout conseil et toutes critiques

  2. #2
    Expert éminent sénior Avatar de Uther
    Homme Profil pro
    Tourneur Fraiseur
    Inscrit en
    Avril 2002
    Messages
    4 627
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Tourneur Fraiseur

    Informations forums :
    Inscription : Avril 2002
    Messages : 4 627
    Points : 15 788
    Points
    15 788
    Par défaut
    Tu peux en effet la réaliser en Java ou n'importe quel autre langage pour faire des application de type Desktop(C++/C#/Delphi/...).
    Le fait de se débarrasser de toute la partie serveur devrait être bénéfique au performances. Par contre je n'ai pas une idée précise de la différence de performance Java/Php.

    As tu quelques connaissance en java?

  3. #3
    Membre régulier
    Profil pro
    Inscrit en
    Février 2007
    Messages
    186
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2007
    Messages : 186
    Points : 71
    Points
    71
    Par défaut
    Merci de ta réponse
    Oui j'ai déja quelques bonne notions en java c'est pour ça que je privilège ce langage à d'autre tels que le C, C++...

    Après reste à savoir si l'accès à des fichier sur internet est optimisé en java par rapport au php.

  4. #4
    Membre à l'essai
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    29
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 29
    Points : 24
    Points
    24
    Par défaut
    Du code java et du code PHP, il n'y a pas photo
    => En java tu as une architecture plus claire ( builders faiblement dépendants ), et donc blindage possible de ton appli

  5. #5
    Expert éminent sénior Avatar de Uther
    Homme Profil pro
    Tourneur Fraiseur
    Inscrit en
    Avril 2002
    Messages
    4 627
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Tourneur Fraiseur

    Informations forums :
    Inscription : Avril 2002
    Messages : 4 627
    Points : 15 788
    Points
    15 788
    Par défaut
    Après reste à savoir si l'accès à des fichier sur internet est optimisé en java par rapport au php.
    Je pense que la vitesse d'accès a un fichier sur internet dépend plus de la connexion que du langage utilisé.

    Du code java et du code PHP, il n'y a pas photo
    => En java tu as une architecture plus claire ( builders faiblement dépendants ), et donc blindage possible de ton appli
    Il très facile de faire quelque chose de moche en java. Même si c'est vrai qu'en PHP c'est encore plus facile.

    De plus, architecture claire ne veut pas forcément dire plus puissante au niveau performance. Je peux te certifier que quand je développait sur mobile, on ne reculait devant aucune horreur pour gagner en vitesse et taille.

  6. #6
    Expert éminent sénior
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 482
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 45
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 482
    Points : 48 804
    Points
    48 804
    Par défaut
    sinon, en java, un petit coup de commons http client pour pomper la page, un petit coup de nekohtml pour transformer ça en arbre DOM, et un petit coup de xpath pour extraire tout les liens. Avoir la liste des liens pour une url donnée devrais pas prendre plus d'une 100 aine de ligne avec ces outils

  7. #7
    Expert éminent sénior Avatar de Uther
    Homme Profil pro
    Tourneur Fraiseur
    Inscrit en
    Avril 2002
    Messages
    4 627
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Tourneur Fraiseur

    Informations forums :
    Inscription : Avril 2002
    Messages : 4 627
    Points : 15 788
    Points
    15 788
    Par défaut
    En même temps même pas besoin de commons http client, S'il s'agit seulement de lire des pages web.
    Les trois ligne suivantes devraient suffire:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
                URL url = new URL("htp://www.monsite.com");
                URLConnection cnx = url.openConnection();
                BufferedReader in = new BufferedReader(new InputStreamReader(cnx.getInputStream()));

  8. #8
    Membre chevronné

    Homme Profil pro
    Architecte logiciel
    Inscrit en
    Novembre 2006
    Messages
    1 252
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte logiciel
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Novembre 2006
    Messages : 1 252
    Points : 1 954
    Points
    1 954
    Par défaut
    Citation Envoyé par Uther Voir le message
    En même temps même pas besoin de commons http client
    Oui, tout dépend du besoin. La lib http-client offre des fonctionnalités qui peuvent être utiles :

    • Support HTTPS
    • Prise en charge des proxies
    • Gestion des cookies
    • Gestion des connexions
    • Configuration des timeouts

  9. #9
    Expert éminent sénior Avatar de Uther
    Homme Profil pro
    Tourneur Fraiseur
    Inscrit en
    Avril 2002
    Messages
    4 627
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Orientales (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Tourneur Fraiseur

    Informations forums :
    Inscription : Avril 2002
    Messages : 4 627
    Points : 15 788
    Points
    15 788
    Par défaut
    Certaines fonctionnalités que tu cites sont maintenant gérées l'api java standard :
    * Support HTTPS (depuis java 1.4)
    * Prise en charge des proxies (depuis java 5.0)
    * Gestion des cookies (depuis java 5.0, amélioré en java 6.0)
    * Gestion des timleout(depuis java 5.0)

  10. #10
    Membre chevronné

    Homme Profil pro
    Architecte logiciel
    Inscrit en
    Novembre 2006
    Messages
    1 252
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte logiciel
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Novembre 2006
    Messages : 1 252
    Points : 1 954
    Points
    1 954
    Par défaut
    Yep.

  11. #11
    Membre régulier
    Profil pro
    Inscrit en
    Février 2007
    Messages
    186
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2007
    Messages : 186
    Points : 71
    Points
    71
    Par défaut
    Merci pour vos réponse en tout cas, j'ai essayer la library html-parser pour avoir le code source mais bon c'est vrai que ce que propose Uther est plus simple est donc moins lourd je pense, après un bon coup de xpath et voilà.

    Bon bin je teste ça en java et je posterais les résultats de rendu, si quelqu'un à d'autres idées n'hésitez pas

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. problem Parseur html
    Par taouja dans le forum Services Web
    Réponses: 1
    Dernier message: 24/04/2007, 17h04
  2. Réponses: 5
    Dernier message: 27/06/2006, 16h03
  3. Faire un parseur html
    Par titoff dans le forum Général JavaScript
    Réponses: 1
    Dernier message: 20/12/2005, 14h03
  4. [HTML]Download
    Par fourgeaud dans le forum Balisage (X)HTML et validation W3C
    Réponses: 13
    Dernier message: 26/11/2005, 13h06
  5. Existe t-il un parseur HTML pou extraire des informations?
    Par danje dans le forum API standards et tierces
    Réponses: 1
    Dernier message: 31/10/2005, 12h55

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo