IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement de jobs Discussion :

RegEx sur html


Sujet :

Développement de jobs

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Août 2006
    Messages
    228
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2006
    Messages : 228
    Points : 60
    Points
    60
    Par défaut RegEx sur html
    Bonjour,

    Je récupère une page html et je veux en extraire certaines données. Jusque là rien de grave, la page arrive, elle s'enregistre ou je veux : nickel.

    Dans mon tExtractregexFiel, je lui colle un bout de code du style :
    "<balise>texte</balise>"

    Je cherche quel est le code à placer entre mes balises pour lui dire de récupérer texte. J'ai essayé ([^<>]+), (*?), etc ...

    Je n'y arrive pas ... Rien ne sort dans mon tLogRow

    Si quelqu'un à eu ce cas, je veux bien un peu d'aide.

    Merci d'avance.

  2. #2
    Rédacteur
    Avatar de CyberChouan
    Homme Profil pro
    Directeur technique
    Inscrit en
    Janvier 2007
    Messages
    2 752
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Directeur technique
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Janvier 2007
    Messages : 2 752
    Points : 4 314
    Points
    4 314
    Par défaut
    Je dirais "<balise>(.+)</balise>".

    Pour bien comprendre le fonctionnement de ce composant, je te conseille de regarder le code généré, et également le tutoriel du site sur les expressions régulières.

  3. #3
    Membre du Club
    Profil pro
    Inscrit en
    Août 2006
    Messages
    228
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2006
    Messages : 228
    Points : 60
    Points
    60
    Par défaut
    Merci beaucoup cyberChouan (85 ?)

    Ce tuto m'a l'air très bien fait.

    En fait, j'ai un exemple fournit par l'avant vente Talend et justement quand je regarde le code source, je m'aperçois que le code mis dans le composant tExtract est devenu le java.pattern ...

    Je ne vois pas ou je peux modifier cette pattern puisqu'on ne peut modifier le code source directement ...

    [Edit] : En mettant (.+) la pattern se modifie bien dans le code. Par contre, toujours rien dans mon tLogRow

  4. #4
    Rédacteur
    Avatar de CyberChouan
    Homme Profil pro
    Directeur technique
    Inscrit en
    Janvier 2007
    Messages
    2 752
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Directeur technique
    Secteur : Communication - Médias

    Informations forums :
    Inscription : Janvier 2007
    Messages : 2 752
    Points : 4 314
    Points
    4 314
    Par défaut
    Tu ne peux effectivement pas modifier directement le code Java généré.

    Mais y avoir accès te permet de comprendre comment les paramètres de ton composant influencent le code généré.

    En couplant cette information au tutoriel sur les expressions régulières, tu devrais pouvoir déterminer ce dont tu as besoin pour obtenir un résultat.

    En particulier, tu peux commencer par écrire du vrai code java (Pattern + Matcher) afin de valider que ton expression régulière effectue bien l'extraction souhaitée. Un fois que tes tests Java seront concluants, il te suffira de reporter l'expression dans le composant Talend.

Discussions similaires

  1. [RegEx] REGEX sur balise html: Besoin d'aide !
    Par delphi_jb dans le forum Langage
    Réponses: 11
    Dernier message: 26/07/2012, 16h08
  2. [RegExp] Regex sur HTML
    Par Willpower dans le forum Général JavaScript
    Réponses: 3
    Dernier message: 13/10/2011, 12h51
  3. Regex sur adresse IP
    Par lobiman dans le forum Langage
    Réponses: 5
    Dernier message: 12/09/2006, 16h46
  4. Centrage animation flash sur html
    Par guiguikawa dans le forum Balisage (X)HTML et validation W3C
    Réponses: 3
    Dernier message: 24/02/2006, 19h37
  5. [Regex] Balises Html
    Par onegamer dans le forum Collection et Stream
    Réponses: 2
    Dernier message: 09/08/2005, 16h34

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo