IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

WinDev Discussion :

utilisation de pdfverstexte() (en attendant factur'x)


Sujet :

WinDev

  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Avril 2009
    Messages
    237
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2009
    Messages : 237
    Points : 305
    Points
    305
    Par défaut utilisation de pdfverstexte() (en attendant factur'x)
    Bonjour,

    Auriez-vous qq conseil pour extraire des données d'un fichier pdf avec la fonction pdfverstexte() ?

    C'est dans le but d'extraire les éléments de base de factures :
    - type de pièce : facture, bon de commande, avoir, ...
    - date
    - n° de pièce
    - montant total hors taxe, tva, ttc
    - nom client
    - n° tva ou siret client

    Comment procéder pour avoir un maximum de résultat correct ?

    On analyse ligne à ligne en cherchant des mots clé (date, montant ht, montant TTC, ....) et après, on suppose que la donnée est sur la même ligne et on essaye de l'extraire (c'est très souvent des chiffres)

    On peut utiliser les propriétés des zone texte du pdf (x, y, largueur, hauteur, texte) pour chercher dans une zone particulière par exemple on présuppose que le nom client est dans la partie en haut à droite avec l'adresse ?

    Comment procéder si par exemple les nom de champs et la valeur ne sont pas sur la même ligne ?

  2. #2
    Membre averti
    Profil pro
    Inscrit en
    Avril 2009
    Messages
    237
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2009
    Messages : 237
    Points : 305
    Points
    305
    Par défaut
    J'aurais bien aimé jeter un oeil à l'exemple WD Extraire contenu texte de PDF de la LST 135 mais hélas il est en version 2024 et je suis en version 28.

    Mr PcSoft pourquoi tant de bloquages purement commercial ?

    Un des plus stupide étant l'impossibilité d'installer une version Express sur une machine qui a une version avec licence et clé d'installée (sauf si cela à changé ?)

    Ou bien la possibilité d'accéder à toutes les bases de données possibles et imaginables mais impossible de faire cohabiter simplement une analyse 5.5 et une analyse classique.

    ...

    Désolé, c'est un mauvais week-end

  3. #3
    Membre régulier
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2023
    Messages
    52
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Développeur informatique

    Informations forums :
    Inscription : Septembre 2023
    Messages : 52
    Points : 105
    Points
    105
    Par défaut
    Bonjour lubinfo,
    La réponse n'est pas évidente.
    Les factures ont-elles toutes la même origine?
    Il est important de la savoir car si ce n'est pas le cas, ça complexifie d'avantage.
    Pour une source unique, Il est possible d'espérer que les factures ont toutes la même structure (position d'une info, etc...)

    S'agit-il toujours de facture créées numériquement (par une autre application) ou ces PDF peuvent-ils contenir une image de facture (scan de facture)?
    Dans le cas d'images, il faudra opérer par OCR avec les risques d'erreurs supplémentaires induits par la méthode.

    L'idéal serait effectivement un document FacturX contenant un XML structuré.

    Pour une version Express sur un poste où est installé une version commerciale, il y a une possibilité : Installer sur une machine Virtuelle.
    Cdlt

  4. #4
    Membre expert

    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2004
    Messages
    2 335
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Calvados (Basse Normandie)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2004
    Messages : 2 335
    Points : 3 844
    Points
    3 844
    Par défaut
    Bonjour,

    A mon avis, tu devrais regarder l'exemple OCR de Windev.
    Et aussi côté ChatGPT 4, il est bluffant sur l'analyse de fichier.

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Avril 2009
    Messages
    237
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2009
    Messages : 237
    Points : 305
    Points
    305
    Par défaut
    Citation Envoyé par Lo² Voir le message
    Bonjour,

    A mon avis, tu devrais regarder l'exemple OCR de Windev.
    Et aussi côté ChatGPT 4, il est bluffant sur l'analyse de fichier.
    J'avais essayé de poser le pb à chatgpt mais il a tendance à proposer du code windev avec des fonctions ... qui n'existent pas en windev !

    Je peux moi aussi proposer un code avec l'appel à une fonction du genre RetourneLaSolutionAuProblème() !

    Ok pour regarder les fonctions OCR (pour les documents scannés et pas pdf natifs) mais le pb ce n'est pas tellement de trouver un texte que de savoir à quoi il correspond.

  6. #6
    Membre expert

    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2004
    Messages
    2 335
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 49
    Localisation : France, Calvados (Basse Normandie)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juin 2004
    Messages : 2 335
    Points : 3 844
    Points
    3 844
    Par défaut
    Pour chapgpt, ce n'est pas du code qu'il faut demander mais tu peux lui donner à manger un pdf et lui demander de t'extraire tel ou tel type d'infos au format json.

Discussions similaires

  1. [WD18] Utilisation d'une DLL attendant un type vector
    Par dav-perso dans le forum WinDev
    Réponses: 6
    Dernier message: 04/10/2016, 15h19
  2. [XL-2010] Fichier de validation de factures: Utiliser une zone de liste pour filtrer une base
    Par Arnold35 dans le forum Macros et VBA Excel
    Réponses: 0
    Dernier message: 07/02/2015, 11h44
  3. 83% de possesseurs de smartphones l'utilisent en attendant quelqu'un
    Par Stéphane le calme dans le forum Mobiles
    Réponses: 1
    Dernier message: 06/03/2014, 03h46
  4. Réponses: 14
    Dernier message: 12/06/2011, 20h34
  5. utiliser CrystalReport pour imprimer une facture
    Par rihab007 dans le forum Windows Forms
    Réponses: 3
    Dernier message: 01/07/2008, 17h33

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo