IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Développement de jobs Discussion :

lire un fichier pdf afin de l'inclure dans une base de donnée


Sujet :

Développement de jobs

  1. #1
    Candidat au Club
    Inscrit en
    Mai 2009
    Messages
    4
    Détails du profil
    Informations forums :
    Inscription : Mai 2009
    Messages : 4
    Points : 2
    Points
    2
    Par défaut lire un fichier pdf afin de l'inclure dans une base de donnée
    Bonjour,

    Je souhaites passer d'un stockage fichier à un stockage base de données.
    Pour ce faire, je fais tourner un job talend qui me liste le contenu de mon répertoire, lit chaque fichier, en extrait le contenu et l'intègre dans un champ (text) d'une base de données.

    Les fichiers sont de type pdf.

    Je n'arrive pas à trouver de composant me permettant de lire un fichier en une fois afin de récupérer son contenu dans une variable.

    Quelqu'un aurait-il une piste ?

    Merci d'avance.

  2. #2
    Membre actif
    Profil pro
    Inscrit en
    Mai 2005
    Messages
    465
    Détails du profil
    Informations personnelles :
    Âge : 41
    Localisation : France

    Informations forums :
    Inscription : Mai 2005
    Messages : 465
    Points : 287
    Points
    287
    Par défaut
    Il n'y a pas de composant qui permette de lire le contenu d'un fichier PDF. Mais ptet existe-t-il une solution...

    Tu as un outil qui s'appelle PDF2HTML qui te permettra d'avoir un fichier HTML à partir d'un PDF.
    Après, il te faudra sûrement utiliser des expressions régulières afin d'extraire le contenu de ces fichiers...

    Peut-être existe-t-il une librairie Java de traitement de fichiers PDF que tu pourrais intégrer dans Talend? Je ne m'y connais pas vraiment en intégration de librairies externes dans Talend.

    Ca m'a l'air assez ardu, ton truc...

  3. #3
    Candidat au Club
    Inscrit en
    Mai 2009
    Messages
    4
    Détails du profil
    Informations forums :
    Inscription : Mai 2009
    Messages : 4
    Points : 2
    Points
    2
    Par défaut
    c'est pas si hardu que ça dans le principe et talend semble correspondre parfaitement au besoin de base :
    - lister les fichiers d'un répertoire
    - vérifier leur existence
    - découper le nom pour savoir quel est l'enregistrement dans la base
    - et ensuite .... intégrer le contenu du fichier (et c'est là que ça coince )

  4. #4
    Candidat au Club
    Inscrit en
    Mai 2009
    Messages
    4
    Détails du profil
    Informations forums :
    Inscription : Mai 2009
    Messages : 4
    Points : 2
    Points
    2
    Par défaut
    ok trouvé :

    utilisation d'un TJava après un TFileExists
    dans le TJava ajout de la routine

    String chaine = new String() ;
    InputStream ips=new FileInputStream(((String)globalMap.get("tFileExist_2_FILENAME")));
    InputStreamReader ipsr=new InputStreamReader(ips);
    BufferedReader br=new BufferedReader(ipsr);
    String ligne;
    while ((ligne=br.readLine())!=null){
    chaine+=ligne+"\n";
    }
    br.close();

    Puis utilisation de la variable chaine de mon objet TJava dans l'objet suivant.

  5. #5
    Candidat au Club
    Inscrit en
    Mai 2009
    Messages
    4
    Détails du profil
    Informations forums :
    Inscription : Mai 2009
    Messages : 4
    Points : 2
    Points
    2
    Par défaut
    meilleure solution (plus propre)

    création d'une routine avec une fonction readFile qui prend en paramètre le nom du fichier
    dans un tmap, appelé routines.nomdeclasse.nomdefonction(nom du fichier)

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Chargement d'un fichier Excel afin de l'intégrer dans une base MySQL
    Par JuniorBI dans le forum Développement de jobs
    Réponses: 9
    Dernier message: 15/07/2017, 00h32
  2. Réponses: 3
    Dernier message: 14/03/2016, 23h37
  3. Réponses: 1
    Dernier message: 18/09/2011, 01h55
  4. Réponses: 3
    Dernier message: 26/03/2010, 17h48
  5. lire un fichier excel xls et l'exporter dans une db Mysql
    Par etarip dans le forum Administration
    Réponses: 4
    Dernier message: 10/10/2005, 16h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo