IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Forum général Business Intelligence Discussion :

Projet de recuperation des données sources via un logiciel OCR


Sujet :

Forum général Business Intelligence

  1. #1
    Nouveau membre du Club
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Novembre 2015
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Novembre 2015
    Messages : 33
    Points : 30
    Points
    30
    Par défaut Projet de recuperation des données sources via un logiciel OCR
    Bonjour à tous,
    J'aimerais essayer de monter une petite solution permettant de récupérer les données dans des fichiers (word, excel, pdf...) ou répertoires afin de nourrir mon ODS. Je sais qu'il y a des solutions de logiciels OCR qui permettent de lire et récupérer l'ensemble des infos prises dans les divers fichiers (et bien entendu, je n'arrive pas à concevoir une bonne récupération si les documents ne sont pas flaggé un minimum). Cependant, j'aimerais connaitre vos avis sur une telle approche pour ceux qui ont déjà manipulé un OCR et qui ont une expérience en exploitation de donnée.
    Merci d'avance pour vos avis.

  2. #2
    Membre du Club
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Décembre 2016
    Messages
    42
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Décembre 2016
    Messages : 42
    Points : 69
    Points
    69
    Par défaut
    Bonsoir

    Je ne comprends pas très bien ta question.

    S'il s'agit d'extraire les données d'un PDF pour insérer dans une base de données, ça c'est possible et facile à le faire grace à un ETL. Mais le PDF ne doit pas être une image.

    Qu'est ce que tu entends par OCR?

    Bonne journée
    wcfsmart

  3. #3
    Nouveau membre du Club
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Novembre 2015
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Novembre 2015
    Messages : 33
    Points : 30
    Points
    30
    Par défaut
    Bonjour,
    Merci pour ton retour.
    J'ai travaillé sur ETL il y a quelques années mais à l'époque, on m'avais déconseillé d'utiliser les fonctions lisant les documents excel, world et pdf. Je vais tester rapidement avec Talend et Pentaho (oui j'ai plus accès à des ETL propriétaires.. )

    Sinon, pour le logiciel OCR, je parle de ce genre d'outils http://www.reneelab.fr/product-land-337.html, et j'ai peut être été trop rapide en disant vouloir alimenté mon ODS avec...
    Mais ce n'est pas des conseils provenant de personne habitué à la BI. Ca va faire plus d'un an que je suis dans une boite de codeurs et leurs approches sont différentes...

    Je fais un retour dès que j'ai pu tester la solution via TOS ou PDI.

    Bonne journée.

  4. #4
    Membre du Club
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Décembre 2016
    Messages
    42
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Décembre 2016
    Messages : 42
    Points : 69
    Points
    69
    Par défaut
    Bonjour

    S'il s'agit d'une image ou issue d'un scan, dans ce cas une solution ETL serait un peu compliquée à mon avis.

    Par contre Excel, et PDF ordinaires se gèrent très bien avec des solutions ETL.

    Bonne journée
    wcfsmart

Discussions similaires

  1. [1.x] recuperation des données via le formulaire
    Par nechalus dans le forum Symfony
    Réponses: 1
    Dernier message: 18/08/2010, 16h08
  2. Recuperation des données dans une source de données
    Par randriamanana dans le forum ASP.NET
    Réponses: 2
    Dernier message: 13/07/2009, 16h45
  3. [VB6][MYSQL] recuperer des données MySQL via PHP
    Par psykotox dans le forum VB 6 et antérieur
    Réponses: 10
    Dernier message: 18/01/2008, 11h25
  4. recuperer des données MySQL via PHP en VB6
    Par pobrouwers dans le forum Requêtes
    Réponses: 1
    Dernier message: 06/04/2007, 12h33
  5. Réponses: 3
    Dernier message: 22/02/2004, 20h09

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo