|
Publicité ' | |||||||||||||||||||||||
|
|
#1 |
|
Invité régulier
![]() Inscription : août 2006 Messages : 104 ![]() |
Bonjour,
Je récupère une page html et je veux en extraire certaines données. Jusque là rien de grave, la page arrive, elle s'enregistre ou je veux : nickel. Dans mon tExtractregexFiel, je lui colle un bout de code du style : "<balise>texte</balise>" Je cherche quel est le code à placer entre mes balises pour lui dire de récupérer texte. J'ai essayé ([^<>]+), (*?), etc ... Je n'y arrive pas ... Rien ne sort dans mon tLogRow Si quelqu'un à eu ce cas, je veux bien un peu d'aide. Merci d'avance. |
|
|
00
|
|
|
#2 |
![]() ![]() |
Je dirais "<balise>(.+)</balise>".
Pour bien comprendre le fonctionnement de ce composant, je te conseille de regarder le code généré, et également le tutoriel du site sur les expressions régulières.
__________________
|
|
00
|
|
|
#3 |
|
Invité régulier
![]() Inscription : août 2006 Messages : 104 ![]() |
Merci beaucoup cyberChouan (85 ?)
Ce tuto m'a l'air très bien fait. En fait, j'ai un exemple fournit par l'avant vente Talend et justement quand je regarde le code source, je m'aperçois que le code mis dans le composant tExtract est devenu le java.pattern ... Je ne vois pas ou je peux modifier cette pattern puisqu'on ne peut modifier le code source directement ... [Edit] : En mettant (.+) la pattern se modifie bien dans le code. Par contre, toujours rien dans mon tLogRow |
|
|
00
|
|
|
#4 |
![]() ![]() |
Tu ne peux effectivement pas modifier directement le code Java généré.
Mais y avoir accès te permet de comprendre comment les paramètres de ton composant influencent le code généré. En couplant cette information au tutoriel sur les expressions régulières, tu devrais pouvoir déterminer ce dont tu as besoin pour obtenir un résultat. En particulier, tu peux commencer par écrire du vrai code java (Pattern + Matcher) afin de valider que ton expression régulière effectue bien l'extraction souhaitée. Un fois que tes tests Java seront concluants, il te suffira de reporter l'expression dans le composant Talend.
__________________
|
|
00
|
Copyright © 2000-2012 - www.developpez.com