IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langages de programmation Discussion :

Quel est le meilleur langage pour parser un document


Sujet :

Langages de programmation

  1. #1
    Membre du Club

    Homme Profil pro
    Développeur Java
    Inscrit en
    Juillet 2009
    Messages
    50
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juillet 2009
    Messages : 50
    Points : 49
    Points
    49
    Billets dans le blog
    1
    Par défaut Quel est le meilleur langage pour parser un document
    Bonjour,

    Je dois parser des documents et je compte le faire à l'aide d'expressions régulières. Néanmoins, étant donné le nombre important de documents à traiter, j'aurais aimé savoir quels étaient les langages les plus rapides pour ce genre de traitement :
    - java
    - perl
    - C/C++
    - autre langage

    Merci d'avance,

    Schnuffel

  2. #2
    Modérateur
    Avatar de gangsoleil
    Homme Profil pro
    Manager / Cyber Sécurité
    Inscrit en
    Mai 2004
    Messages
    10 150
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Savoie (Rhône Alpes)

    Informations professionnelles :
    Activité : Manager / Cyber Sécurité

    Informations forums :
    Inscription : Mai 2004
    Messages : 10 150
    Points : 28 121
    Points
    28 121
    Par défaut
    Bonjour,

    Le traitement de chaine de caractere se fait bien en perl.

    Pour le C, ca depend si ton entree est formatee ou non : si oui, ca peut etre tres efficace, sans etre trop complexe a developper. Si non, oublie.

    Je ne connais pas suffisamment les autres langages pour repondre.
    "La route est longue, mais le chemin est libre" -- https://framasoft.org/
    Les règles du forum

  3. #3
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 610
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 610
    Points : 17 916
    Points
    17 916
    Billets dans le blog
    2
    Par défaut
    si c'est sur unixoides, awk et sed feront ton bonheur..
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  4. #4
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 287
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 287
    Points : 36 778
    Points
    36 778
    Par défaut
    Salut,

    A peu près tout les langages proposent une API assez "efficace" pour parser des expressions régulières. Perl/Python et probablement PHP s'appuient sur la bibliothèque C regex. Donc une fois que les données sont en mémoire, on devrait arriver à rendre acceptable les différences entre les langages compilés et scripts.

    Après çà dépend un peu du nombre de regexp à gérer/soumettre à l'ensemble des fichiers et de la flexibilité qu'il sera nécessaire d'avoir dans leur modifications.
    - 1 regexp pour X fichiers, grep/sed suffiront (et existent sous Windows).
    - plein de regexp évolutives à appliquer: le gros du boulot sera dans l'interface utilisateur et éventuellement dans la gestion d'une parallélisation des traitements.
    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

  5. #5
    Membre du Club

    Homme Profil pro
    Développeur Java
    Inscrit en
    Juillet 2009
    Messages
    50
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juillet 2009
    Messages : 50
    Points : 49
    Points
    49
    Billets dans le blog
    1
    Par défaut
    Merci beaucoup, ça répond bien à ce que je voulais savoir !

    Schnuffel

  6. #6
    Membre éprouvé

    Homme Profil pro
    Directeur des systèmes d'information
    Inscrit en
    Septembre 2010
    Messages
    450
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Directeur des systèmes d'information

    Informations forums :
    Inscription : Septembre 2010
    Messages : 450
    Points : 1 073
    Points
    1 073
    Par défaut
    Je ne sais pas si Java est plus rapide que les autres, mais en tout cas l'API est plutôt puissante pour ce genre de choses.

    Sinon effectivement Python ça peut être pertinent, et c'est probablement plus rapide à coder.

    C et C++, si tu doit juste parser des documents: ce n'est pas très approprié, tu va augmenter ton temps de dev a cause de la complexité plus grande du langage, sans gagner en retour de bonus intéressant dans ce cadre.

    Après, tout dépend ce que tu fais de ce bout de code: C'est intégré dans un projet plus grand? ça tourne sous quoi? As-tu des contraintes fonctionnelles ou techniques? etc etc...
    Si vous moinsez, merci de répondre pour argumenter!
    Ma présentation

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Quel est le meilleur langage pour la programmation parallèle ?
    Par dourouc05 dans le forum Programmation parallèle, calcul scientifique et de haute performance (HPC)
    Réponses: 70
    Dernier message: 12/04/2012, 21h49
  2. Quel est le meilleur langage pour la reconnaissance d'empreintes ?
    Par hanou88 dans le forum Traitement d'images
    Réponses: 4
    Dernier message: 09/02/2011, 07h58
  3. Débat : Quel est le meilleur langage pour coder en open-source ?
    Par Katleen Erna dans le forum Actualités
    Réponses: 15
    Dernier message: 17/08/2009, 10h54
  4. Quel est le meilleur langage pour la portabilité : Windows & Linux (voire Mac) ?
    Par iubito dans le forum Débats sur le développement - Le Best Of
    Réponses: 57
    Dernier message: 26/11/2007, 23h45
  5. Réponses: 4
    Dernier message: 12/05/2007, 00h55

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo