ABBYY Cloud OCR SDK : un SDK de reconnaissance de texte, de conversion de documents basé sur l’IA
avec un support multiplateforme
ABBYY, une entreprise qui propose des technologies et des solutions basées sur l'intelligence artificielle (IA), lance ABBYY Cloud OCR SDK, un SDK de reconnaissance de texte, de conversion de documents et d’extraction de données. Il est basé sur l’intelligence artificielle, utilise la puissance de calcul du cloud et dispose d’un support multiplateforme. Il est accessible via une API Web qui peut être facilement utilisée avec plusieurs langages dont C#, Java, Python ou tout autre outil de développement prenant en charge la communication réseau. La reconnaissance optique de caractères (ROC), en anglais optical character recognition (OCR), est une technique vieille de plusieurs dizaines d'années.
Encore appelé océrisation, il désigne les procédés informatiques pour la traduction d'images, de textes imprimés ou dactylographiés en fichiers textuel. Un ordinateur réclame pour l'exécution de cette tâche un logiciel d'OCR. Celui-ci permet de récupérer le texte dans l'image d'un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou sur un autre support exploitable par un système informatique.
Les technologies se sont multipliées au fil des années et nous sommes aujourd’hui à l’ère du cloud qui offre une puissance de calcul énorme aux entreprises qui l’adoptent. ABBYY présente un nouvel outil de ce type, mais basé sur l’intelligence artificielle et bénéficiant des avantages du cloud. ABBYY Cloud OCR SDK, de son nom, est un SDK de reconnaissance de texte, de conversion de documents et d’extraction de données. Il fonctionne grâce à une API Web adressable à partir de plusieurs langages de programmation.
Selon la documentation qui accompagne l’outil, l'API Web peut être facilement utilisée en C#, Java, Python, .NET, PHP, Ruby, ASP.NET et JavaScript ou tout autre outil de développement prenant en charge la communication sur le réseau (.NET for receipts, cURL). Le site officiel de la solution fournit un ensemble d’exemples dans différents langages de programmation qui montrent comment créer une application simple. Il est multiplateforme et prend en charge Windows, iOS et Android. Voici quelques caractéristiques/fonctions d'ABBYY Cloud OCR SDK :
Reconnaissance de texte
Basé sur la technologie OCR FineReader, ABBYY Cloud OCR SDK prend en charge la reconnaissance des textes imprimés dans plus de 200 langues, dont la plupart des langues asiatiques : chinois, japonais, coréen, arabe, farsi, vietnamien, thaï et autres. De plus, ABBYY Cloud OCR SDK reconnaît le texte imprimé dans des champs spécifiques (OCR zonal). Ces fonctions de reconnaissance sont utilisées pour lire des formulaires, des factures, des documents fiscaux, médicaux, financiers et autres documents structurés et semi-structurés ; y compris ceux remplis à la main.
Conversion de documents
Selon ABBYY, les fonctions de conversion PDF avancées de Cloud OCR SDK réduisent jusqu'à 10 fois la taille des images numérisées et des PDF. Il préserve la qualité visuelle grâce à la puissante technologie de compression MRC et à la prise en charge des formats PDF et PDF/A interrogeables. L’entreprise ajoute que la technologie ADRT (Advanced Document Recognition Technology) lui offre une capacité inégalée pour comprendre et recréer la structure et la mise en page du document original, tout en convertissant la version numérisée de l’image numérisée ou PDF au format Microsoft Office éditable.
Extraction de données
ABBYY Cloud OCR SDK capture des données structurées à partir de reçus de bande ; y compris le nom du fournisseur, les données, le montant total, les autres champs clés et les éléments de ligne. La technologie est localisée pour prendre en charge les spécificités de la région telles que les taxes locales, les dates, le formatage des adresses. Lecture des informations de contact sur des cartes de visite (nom de l'entreprise, nom de la personne, adresse et titre).
Cette technologie prend en charge les images numérisées, les photos mobiles et l’exportation de données au format vCard. ABBYY Cloud OCR SDK analyse automatiquement les zones lisibles par machine (MRZ) divers documents d’identité, tels que les passeports et les cartes d’identité. Les données reconnues sont converties au format XML, prêtes pour un téléchargement sécurisé et une suppression du serveur via une API. Sinon, les données générées au cours des traitements sont automatiquement supprimées après 48 heures.
Support multiplateforme
ABBYY Cloud OCR SDK vous permet d’ajouter une fonctionnalité OCR sans couche de compatibilité, quel que soit le langage de programmation utilisé dans votre application. Les services sont mis en œuvre selon les principes de l'architecture logicielle REST et peuvent être accessibles via une API à travers de simples requêtes HTTP ou HTTPS facilitant votre processus de développement. Pour ABBYY, il vous permet de fournir à vos clients une reconnaissance de texte de haute qualité sur toutes les plateformes que vous prenez en charge.
ABBYY estime que, quelles que soient les préférences de vos clients en matière de périphérique, l'API REST pour OCR vous évite d'inclure différentes bibliothèques dans vos applications tout en utilisant les mêmes instruments et la même logique pour obtenir des résultats identiques. Il vous permet aussi d’augmenter la vitesse de mise en œuvre grâce à sa bibliothèque d'échantillons de code contenant des extraits de code pour les langages et les plateformes de programmation les plus populaires : Java, Python, .NET, iOS, Android et Windows.
L'API d'ABBYY Cloud OCR SDK utilise les méthodes HTTP POST et HTTP GET pour l'envoi de données à un serveur HTTP. Les paramètres des demandes sont spécifiés dans la chaîne d'URL. L'URL dépend de l'emplacement de traitement de votre application. Vous pouvez accéder au site officiel de la solution pour plus de détails. Notez cependant que l’API est disponible en deux versions : une version XML et une version JSON. Le serveur qui héberge Cloud SDK OCR requiert une authentification avant d'autoriser l'accès à ses ressources sur Internet. Pour vous authentifier sur le serveur, vous aurez besoin d'un identifiant d'application et d'un mot de passe d'application enregistrés.
Téléchargez ABBYY Cloud OCR SDK
Et vous ?
Que pensez-vous d'ABBYY Cloud OCR SDK ?
Partager