Découvrez comment FlexiCapture 12 SDK permet aux développeurs de créer des apps capables d'extraire des informations de tout type de document,
en regardant l'enregistrement du webinaire

À l'occasion d'un webinaire, les développeurs ont eu l'opportunité de découvrir comment FlexiCapture 12 SDK. Ce SDK permet de rapidement créer des applications capables d’extraire des informations de tout type de document. Basé sur les dernières technologies de machine Learning et d’apprentissage automatique, ABBYY FlexiCapture 12 SDK donne aux développeurs des outils modulables et efficaces pour intégrer facilement les technologies de pointe d’ABBYY pour la capture des données à leurs propres produits et services afin de répondre aux besoins verticaux du marché.

Vincent Ramel, Sales Manager TechLicencing (France, Belgique, Luxembourg) s'est chargé de la présentation pour le compte d'ABBYY de ce webinaire intitulé Exportez les résultats de l'OCRisation : les différents formats. Il a organisé son exposé en deux parties :
  • tout d'abord une présentation sommaire de FineReader Engine 12 pour ceux qui ne sont pas familiers avec cet outil. Il en a également profité pour parler des capacités d'OCR de l'outil ;
  • ensuite il est passé aux différents types d'exports, notamment l'export XML, l'export PDF et les nouveautés de la version 12.


La gamme de technologie FlexiCapture

La gamme de technologie FlexiCapture se décompose en trois grandes parties, une instance distribuée, un service Cloud et le SDK. Même si ce webinaire se concentre sur FC SDK, il est important de comprendre le fonctionnement des outils Flexicapture. Cette technologie permet de récupérer n’importe quel type de document (carte d’identité, Avis d’imposition, Factures, Carte Vital, Lettre, Contrat,…) de les classifier et d’en extraire des informations particulières sur la base de règle qui auront été définie, vérifier ces documents et les exportés.

Nom : flexi.png
Affichages : 1803
Taille : 48,3 Ko

Vincent a rappelé que FineReader Engine est une brique OCR, un SDK, un ensemble de bibliothèques que vous pouvez intégrer dans vos propres applications. C'est donc un outil qui permet aux développeurs et aux éditeurs logiciels de créer des applications qui seront capables d'extraire le texte en provenance de documents, d'écran d'ordinateur, de moniteurs, etc. « Aujourd'hui nous sommes capables d'OCRiser à peu près n'importe quel type de document et en 208 langues, notamment les documents en chinois, coréen, japonais, arabe, hébreu, etc. ».

Il précise que, contrairement à ABBYY FlexiCapture, « FineReader Engine ne dispose pas d'un outil d'extraction de données, sauf pour certains cas particuliers tels que les reçus de carte de crédit, les reçus bancaires, etc., les reconnaissances de business card et d'autres modules qui peuvent être intéressants ».

Il a également expliqué les nouveautés qui accompagnent la version 12 de FineReader Engine, qui apporte la possibilité d'installer vos applications sur des environnements virtuels (Azure et AWS étant les principaux qui vont nécessiter la version 12). Les SDK Windows, Linux et macOS X disposent des mêmes fonctionnalités dans cette version, ce qui n'était pas tout à fait le cas en version 11. Bien sûr la reconnaissance de caractère a elle aussi été améliorée.

Workflow Classique de FlexiCapture SDK

FlexiCapture se positionne comme le meilleur outil du marché en matière de data capture grâce à l’intégration d’algorithme basé sur l’intelligence artificielle permettant une maximisation de certaines fonctionnalités clés comme :
  • Capture des données pour tous types de documents : ABBYY FlexiCapture SDK fournit les outils capables d’extraire les données des formulaires figés, ainsi que des documents semi-structurés et non structurés. Toutes les données requises peuvent être rapidement localisées et extraites dans le format approprié.
  • Traitement des factures prêt à l’emploi : FlexiCapture SDK fournit des Projets clé en main pour le traitement des factures. Les champs principaux sont tout de suite extraits, sans qu’aucune configuration supplémentaire ne soit nécessaire.

    Nom : facture.png
Affichages : 742
Taille : 121,1 Ko
    Champ Extractable automatiquement par le module InvoiceGeneric
  • Paramétrage basé sur l’API : l’API de FlexiCapture SDK permet aux développeurs de paramétrer les procédures en partant de zéro ou de peaufiner une procédure existante sans avoir recours à des outils visuels. Par exemple, ils peuvent créer des définitions de projets et de documents, puis les utiliser pour traiter des documents et exercer le système. Ils peuvent aussi développer leurs propres outils pour administrer les projets FlexiCapture.
  • Classification avancée des documents : la classification intégrée des documents permet aux développeurs de créer à partir de zéro un outil de classification, de l’exercer grâce aux résultats de la vérification et de mettre en œuvre l’autoapprentissage pour améliorer la précision des résultats.
  • Apprentissage grâce au retour d’information : FlexiCapture SDK permet aux développeurs de mettre en place un apprentissage pour les procédures d’extraction des champs et de classification. Alimentée par le retour d’information fourni par l’utilisateur, cette technologie améliore considérablement la précision de l’extraction des champs et de la classification.
  • Bibliothèque d’échantillons de code : un ensemble complet d’échantillons de codes explique comment programmer l’utilisation du SDK. Chaque section de la bibliothèque possède des extraits de code accompagnés de consignes pas-à-pas sur la façon d’effectuer telle ou telle tâche. Les développeurs peuvent également réutiliser les échantillons de code dans leurs programmes.


Architecture disponible

Le FlexiCapture se base sur deux stations principales : Le flexiLayout Studio où il est possible de créer les différentes règles d’extraction et le Project Set Up station où les développeurs peuvent mettre ne place le workflow de traitement des documents. Ensuite, autour de ces deux stations gravitent plusieurs stations permettant de fournir différents services aux utilisateurs.

Nom : flexi.png
Affichages : 744
Taille : 147,7 Ko
Architecture distribuée de FlexiCapture

ABBYY peut proposer trois produits à ses clients, notamment FlexiCapture Distribué, FlexiCapture Cloud et FlexiCapture SDK. Cependant, toutes les règles et les processus d’extraction d’information sont à mettre en place dans le Project Setup Station (où les projets sont créés, configurés et débogués) qui est pour sa part lié à l’instance produit que le client souhaite.

FlexiCapture SDK

FlexiCapture SDK est un ensemble de librairies conformes au standard COM et peut être facilement utilisée en C/C+++, Visual Basic, .NET, ou tout autre outil de développement supportant les composants COM. ABBYY FlexiCapture peut être adapté pour être utilisé avec des langages de script comme VBS, JS et Perl.

Bien entendu, pour pouvoir s'en servir, il y a des configurations minimales à avoir, notamment :
  • Mémoire
    • Pour le traitement de documents d'une page : Au moins 400 Mo de RAM, 1 Go de RAM recommandé
    • Pour le traitement de documents de plusieurs pages : Au moins 1 Go de RAM, 1,5 Go de RAM recommandé
  • Espace disque dur
    • Pour l’installation de la bibliothèque :
      • 1400 MB pour les fonctionnalités-clés
      • Jusqu’à 2 GB supplémentaires pour le module OfficeConverters
    • Pour le fonctionnement du programme :
      • 100 MB pour faire fonctionner le programme
      • 15 MB supplémentaires pour chaque page traitée d’un document multipages

Le moyen le plus rapide de commencer à utiliser FlexiCapture SDK est de lire le guide d’utilisation et de consulter l’échantillon de code fourni avec le logiciel. Un éventail complet d’échantillons de code explique comment programmer l’utilisation du SDK. Chaque section de la bibliothèque comprend des extraits de code accompagnés d’instructions pas à pas sur la façon de réaliser chaque tâche. Les développeurs peuvent réutiliser les échantillons de code dans leurs applications pour gagner du temps avec le développement.

Des échantillons de code sont fournis pour C#, C++, Visual Basic .NET, Java et des langues de script. Cela aide les développeurs à voir comment :
  • Démarrer : cet échantillon montre comment effectuer la capture de données avec juste quelques lignes de code. Il permet de débuter le développement. Disponible pour les langages de programmation C++, C#, Visual Basic .NET, Java, JScript, VBScript et Perl.
  • Utiliser la fonctionnalité de classification avancée : montre comment « former » et utiliser le classificateur de documents fourni par ABBYY FlexiCapture SDK. Fonctionne avec les langages de programmation C++ et C#.
  • Se former à l’extraction des champs : montre comment améliorer la technologie d’extraction des champs grâce à l’apprentissage alimenté par le feedback de la vérification dans des systèmes tiers. Fonctionne avec les langages de programmation C++ et C#.
  • Mettre en place le traitement des factures avec l’autoapprentissage : montre comment créer un projet de traitement des factures FlexiCapture, alimenter la base de données du fournisseur et utiliser cette base pour reconnaître les factures et se perfectionner à l’aide du feedback de la vérification dans des systèmes tiers. Fonctionne avec les langages de programmation C++ et C#.


L'export

Les résultats sont disponibles en plusieurs formats, l'idée d'ABBYY étant de pouvoir vous proposer à chaque fois le contenu texte ainsi que la position des mots en différemment formats et tout ceci indépendamment du type de document.

Nom : export.png
Affichages : 834
Taille : 159,1 Ko

Export XML

Le principal export demandé est le XML :

  • XML natif (schéma de sortie du moteur) :
    • coordonnées des caractères (avec / sans informations de redressement) ;
    • alternatives de caractères et mots : variantes de reconnaissance + probabilités (amélioré en 12) ;
    • style de police (gras, italique, taille de police, type de police... ) ;
    • exportation XML étendue avec des informations sur les styles et les rôles de paragraphe ;
    • exporter des informations sur les caractères d'espace de tabulation au format XML (nouveauté 12).
  • Possibilité d'exporter des éléments de liste directement au format XML (nouveauté 12)
  • Microsoft Office XML :
    • .DOCX
    • .XLSX
    • .PPTX
  • Autre format d'export XML :
    • Open Document Text Format : .odt ;
    • E-book Reaser : FB2, ePub ;
    • Bibliothèques  : AltoXML.

    • Texte ASCII :
    • UTF16, UTF8, Simple ;
    • Texte seulement, sans mise en page ni options pour simuler la mise en page dans une police à espacement unique.

Export PDF
  • Différentes options d'exportation :
    • image seule ; texte seulement; texte sous image; texte sur image ;
    • support des hyperliens ;
    • exportation rapide pour les PDF de plusieurs pages volumineuses.
  • Options de sécurité :
    • Prise en charge du mot de passe pour l'impression, la modification, l'ouverture, la copie de texte et de graphique, etc. ;
    • chiffrement AES 256 bits pris en charge (nouveauté version 12).
  • Profils d'exportations PDF prédéfinis :
    • Qualité MAX, Qualité-Taille équilibrée, Taille MIN, Vitesse MAX.

    Formats PDF supportés :
    • PDF (v1.3 - 1.7) PDF 2.0 (nouveau en version 12)
    • PDF UA (nouveau en version 12)
    • MRC (PDF compressé)
    • PDF/A norme PDF pour l'archivage à long terme

Ici, Vincent s'est étendu sur des cas d'utilisation rencontrés par des clients ABBYY en guise d'illustration que vous pourrez découvrir en regardant l'enregistrement du webinaire.

regarder l'enregistrement du webinaire