Bonjour,
Je suis très nouveau dans Talend mais expert en Java, et j'ai besoin encore d'aide pour comprendre la logique de programmation de Talend.
Pour mon environnement de travail, j'utilise le dernier Talend OS Data Integration, sous win7, et Java 1.7
J'ai actuellement un programme de migration en java que je désire convertir en un job Talend. C'est un programme très procédural qui suit généralement la logique suivante:
Ouvrir source de données (excel, par ex.)
pour chaque ligne
- si une condition est remplie:
- lire la valeur d'une colonne et regarder dans une table SQL
- Si la table ne contient pas la valeur, faire un insert avec certaines valeurs
- Récupérer et garder en mémoire certains champs du résultat SQL
- ...
- autre bloc conditionnel similaire mais pas identique
- ...
- encore un autre bloc conditionnel
- ...
Avec des filtres et des tmaps, j'arrive facilement à créer le premier bloc conditionel. Le problème est qu'ensuite, je dois réintégrer en un flux les deux flux que le filtre a créé, c.à.d le flux filtre et le flux reject. Et c'est impossible.
Et c'est là que je ne comprend pas quel approche je dois avoir dans talend, alors que dans java, c'est évident.
Dois-je utiliser un tFlowToIterate et créer des tas de subjobs, lesquels traitent une donnée à la fois? Je crains que ça affecte fortement les performances. Et je crains que ça multiplie les paramètres à définir manuellement, au lieu d'utiliser des schemas. Vu la complexité que ça va engendrer, sachant qu'en java pur c'est très simple, j'ai l'impression que ce n'est pas la bonne approche.
Une bonne âme pourrait-elle me donner un tuyau sur l'approche à avoir? Merci beaucoup.
Partager