IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Plateformes (Java EE, Jakarta EE, Spring) et Serveurs Discussion :

Nutch - Hadoop - UIMA


Sujet :

Plateformes (Java EE, Jakarta EE, Spring) et Serveurs

  1. #1
    Invité
    Invité(e)
    Par défaut Nutch - Hadoop - UIMA
    Bonjour,

    Je cherche de l'information concernant l'extraction de données (Zip Code USA, Code postal Canadien, etc.) avec Apache-UIMA. Nous utilisons Nutch comme "aspirateur de sites" et Hadoop pour gérer notre cluster d'ordinateurs.

    Il s'agit "simplement" de passer UIMA (regex) sur les pages aspirées par nutch et ensuite d'en extraire quelques infos (CodePostal, ZipCode, Tél.) de ces pages. Dois-je faire un plug-in pour nutch? Comment passer UIMA sur le cluster Hadoop (solution privilégiée)? etc....

    Je cherche de l'info sur internet depuis 2 semaines et je suis maintenant au bord du désespoir...

    Avez-vous des suggestions de sites, tutoriels, partage d'expériences, etc

    Merci beaucoup et bonne journée!
    zed

  2. #2
    Invité
    Invité(e)
    Par défaut Plugin Nutch
    Finalement, ce sera un plugin nutch qui indexera ces infos dans l'index de nutch.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 15
    Dernier message: 12/12/2009, 14h27
  2. [Distribué] [Livre] Pro Hadoop disponible chez Apress
    Par *alexandre* dans le forum Autres
    Réponses: 0
    Dernier message: 11/06/2009, 17h44
  3. Nutch et RSS
    Par Stouille89 dans le forum Général Conception Web
    Réponses: 0
    Dernier message: 20/09/2008, 20h31
  4. web crawler integrant nutch
    Par minouml dans le forum Développement Web en Java
    Réponses: 2
    Dernier message: 09/02/2007, 17h05

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo