Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > ETL > Talend
Talend Forum d'entraide sur Talend (Talend Open Studio, ...). Avant de poster --> FAQ Talend, Tutoriels Talend
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 30/04/2011, 15h36   #1
Invité régulier
 
Inscription : août 2006
Messages : 104
Détails du profil
Informations forums :
Inscription : août 2006
Messages : 104
Points : 8
Points : 8
Par défaut RegEx sur html

Bonjour,

Je récupère une page html et je veux en extraire certaines données. Jusque là rien de grave, la page arrive, elle s'enregistre ou je veux : nickel.

Dans mon tExtractregexFiel, je lui colle un bout de code du style :
"<balise>texte</balise>"

Je cherche quel est le code à placer entre mes balises pour lui dire de récupérer texte. J'ai essayé ([^<>]+), (*?), etc ...

Je n'y arrive pas ... Rien ne sort dans mon tLogRow

Si quelqu'un à eu ce cas, je veux bien un peu d'aide.

Merci d'avance.
Scots est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 30/04/2011, 23h32   #2
Rédacteur/Modérateur
 
Avatar de CyberChouan
 
Homme Benoît Courtine
Directeur technique
Inscription : janvier 2007
Messages : 2 744
Détails du profil
Informations personnelles :
Nom : Homme Benoît Courtine
Âge : 29
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Directeur technique
Secteur : High Tech - Produits et services télécom et Internet

Informations forums :
Inscription : janvier 2007
Messages : 2 744
Points : 4 202
Points : 4 202
Envoyer un message via MSN à CyberChouan
Je dirais "<balise>(.+)</balise>".

Pour bien comprendre le fonctionnement de ce composant, je te conseille de regarder le code généré, et également le tutoriel du site sur les expressions régulières.
__________________
Avant de poster, pensez à regarder la FAQ, les tutoriaux, la Javadoc (de la JRE que vous utilisez) et à faire une recherche
Je ne réponds pas aux questions techniques par MP: les forums sont faits pour ça
Mes articles et tutoriaux & Mon blog informatique
CyberChouan est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 01/05/2011, 07h56   #3
Invité régulier
 
Inscription : août 2006
Messages : 104
Détails du profil
Informations forums :
Inscription : août 2006
Messages : 104
Points : 8
Points : 8
Merci beaucoup cyberChouan (85 ?)

Ce tuto m'a l'air très bien fait.

En fait, j'ai un exemple fournit par l'avant vente Talend et justement quand je regarde le code source, je m'aperçois que le code mis dans le composant tExtract est devenu le java.pattern ...

Je ne vois pas ou je peux modifier cette pattern puisqu'on ne peut modifier le code source directement ...

[Edit] : En mettant (.+) la pattern se modifie bien dans le code. Par contre, toujours rien dans mon tLogRow
Scots est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 04/05/2011, 08h23   #4
Rédacteur/Modérateur
 
Avatar de CyberChouan
 
Homme Benoît Courtine
Directeur technique
Inscription : janvier 2007
Messages : 2 744
Détails du profil
Informations personnelles :
Nom : Homme Benoît Courtine
Âge : 29
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Directeur technique
Secteur : High Tech - Produits et services télécom et Internet

Informations forums :
Inscription : janvier 2007
Messages : 2 744
Points : 4 202
Points : 4 202
Envoyer un message via MSN à CyberChouan
Tu ne peux effectivement pas modifier directement le code Java généré.

Mais y avoir accès te permet de comprendre comment les paramètres de ton composant influencent le code généré.

En couplant cette information au tutoriel sur les expressions régulières, tu devrais pouvoir déterminer ce dont tu as besoin pour obtenir un résultat.

En particulier, tu peux commencer par écrire du vrai code java (Pattern + Matcher) afin de valider que ton expression régulière effectue bien l'extraction souhaitée. Un fois que tes tests Java seront concluants, il te suffira de reporter l'expression dans le composant Talend.
__________________
Avant de poster, pensez à regarder la FAQ, les tutoriaux, la Javadoc (de la JRE que vous utilisez) et à faire une recherche
Je ne réponds pas aux questions techniques par MP: les forums sont faits pour ça
Mes articles et tutoriaux & Mon blog informatique
CyberChouan est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 09h30.


 
 
 
 
Partenaires

Hébergement Web