IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

Lecture fichier PDF et extraction de données avec Java


Sujet :

Java

  1. #1
    Membre confirmé
    Inscrit en
    Juillet 2009
    Messages
    121
    Détails du profil
    Informations forums :
    Inscription : Juillet 2009
    Messages : 121
    Par défaut Lecture fichier PDF et extraction de données avec Java
    Salut les amis,
    J'ai un problème dont je désir avoir votre avis la dessous:
    Je suis entrain de réaliser une application web qui, parmi ses fonctions, fait un traitement sur un fichier d'entrée. Normalement, ce fichier est de format excel avec une structure bien précise; Pourtant, selon des cas particuliers cette structure, peut changer d'un fichier excel à l'autre, malgrès cela je pense trouver la solution, en programmant une interface qui invite l'utilisateur à spécifier la structure du fichiers excel en entréé (par exemple la position d'une telle colonne est B6, etc. ...). Malheureusement, le fichier d'entrée peut être de format pdf, est-ce que vous avez une idée sur cela les amis, autrement dit est-ce que je peut lire un fichier pdf, extraire les données voulues, et les sauvegarder dans la base de données (Oracle), pour qu'elles subissent un traitement par la suite, ou je doit forcément inciter le client de l'application à préparer un fichier excel avec une structure standard, comme contrainte de l'application, avant de charger le fichier.

    Je vous signale que je programme l'application web avec java J2EE/JSF/Hibernate et une base de données Oracle.


    Aidez moi SVP, et merci d'avance

  2. #2
    Expert éminent
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 482
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 482
    Par défaut
    Vous pouvez lire un fichier PDF avec, par exemple pdfbox, etc.

    Cependant, vous devez être conscient que PDF est une format de présentation, par un format de structuration de données. Si vous faites des tests (par exemple avec adobe acrobat writer) d'exportation pdf -> txt, vous constaterez que suivant vos documents de départ, vos données ne vont pas toujours être structurée de la même manière. Ainsi, pour ce tableau:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    *---*---*---*
    | A | B | C |
    *---*---*---*
    | D | E | F |
    *---*---*---*
    | G | H | I |
    *---*---*---*
    Vous pourriez a l'exportation récupérer aussi bien
    A B C D E F G H I
    que
    A D G B E H C F I
    et toutes les variantes du genre
    A B D C E G F H I
    etc.

    En fait, le PDf ne contient que des instructions du style "dessiner une ligne verticale à x,y" "écrire 'A' à 5cm du bord gauche, 2cm du bord haut, etc.

    Si il y a des cellules du tableau avec plusieurs lignes, chaque ligne aura sa propre entrée dans le pdf puisque dessinée à des endrois différents.

    C'est vraiment à l'utiliser qu'en dernier recours!

  3. #3
    Membre confirmé
    Inscrit en
    Juillet 2009
    Messages
    121
    Détails du profil
    Informations forums :
    Inscription : Juillet 2009
    Messages : 121
    Par défaut
    Merci pour votre réponse. Je crois devoir opter pour une structure standard du fichier excel d'entrée, sinon au moins un fichier excel avec une structure dynamique.

Discussions similaires

  1. Extraction de données avec filtre d'un fichier excel
    Par debutant2010 dans le forum Macros et VBA Excel
    Réponses: 5
    Dernier message: 22/05/2014, 13h25
  2. stocker des fichiers dans une base de données avec java
    Par dali0802 dans le forum Général Java
    Réponses: 4
    Dernier message: 08/04/2014, 17h21
  3. Réponses: 40
    Dernier message: 15/12/2013, 20h05
  4. Réponses: 2
    Dernier message: 19/08/2009, 21h17
  5. MSSQL : extraction de données avec bcp
    Par khaledus dans le forum Outils
    Réponses: 1
    Dernier message: 24/08/2007, 14h58

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo