Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Chroniqueur Actualités

    ABBYY propose aux développeurs une série de webinaires pour les familiariser au NLP et au Machine Learning
    ABBYY propose aux développeurs une série de webinaires pour les familiariser au NLP et au Machine Learning
    le premier aura lieu le 9 avril à 14H00 CEST

    Le NLP (Natural Language Processing) ou traitement automatique du langage naturel est une discipline de l’intelligence artificielle qui couvre plusieurs champs de recherche et a plusieurs applications. Parmi elles nous avons la sémantique (correction orthographique, agents conversationnels, résumé automatique de texte, etc.), le traitement du signal (reconnaissance de l'écriture manuscrite, reconnaissance optique de caractères et lecture automatique de document, synthèse vocale, etc.), l’extraction des informations (fouille de texte, classification et catégorisation de documents, analyse de sentiment, etc.).

    Débuter en NPL et en machine learning peut être déroutant. Aussi, pour les personnes désireuses d’explorer cette discipline et d’en savoir plus sur ses champs d’application, ABBYY propose une série de webinaires dont le premier débutera ce jeudi 09 avril 2019 à 14H00. Les hôtes seront Pierre Hagot, Partner Account Manager et Olivier Vasseur, Solution Architect.

    « Nous vous invitons à une nouvelle série de webinaires qui a pour but de vous familiariser avec les technologies derrière nos solutions de Digital Intelligence. Le premier, l’introduction au NLP et Machine Learning, vous montrera en 20 minutes comment nos solutions vous aident à analyser tout type de documents », propose l'éditeur.


    En quoi ABBYY serait-il qualifié pour en parler ? ABBYY est une structure qui propose des solutions et des technologies basées sur l’IA. Parmi elles nous pouvons citer :
    • Cloud OCR SDK, un SDK de reconnaissance de texte, de conversion de documents et d’extraction de données. . Il est basé sur l’intelligence artificielle, utilise la puissance de calcul du cloud et dispose d’un support multiplateforme. Il est accessible via une API Web qui peut être facilement utilisée avec plusieurs langages dont C#, Java, Python ou tout autre outil de développement prenant en charge la communication réseau.
    • La technologie de machine learning FlexiCapture, qui s'adresse aux entreprises qui peinent à capturer et transformer les contenus non structurés des documents, formulaires et courriers, en données structurées signifiantes afin d'automatiser leurs opérations dans le cloud ou sur site. Tous les documents en lien avec les résultats et l'expérience client sont concernés : factures, réclamations, ouverture de compte, documents d'enregistrement de nouveau client, bons de commande, lettres de transport et contrats.
    • ABBYY Mobile Capture, qui donne aux développeurs la possibilité d'offrir à leurs clients une expérience exceptionnelle en facilitant la capture de documents sur mobile grâce à un processus simple en deux étapes : pointer et capturer. ABBYY Mobile Capture est un SDK (Kit de Développement Logiciel) qui permet une capture automatique des données sur votre appli mobile, ainsi qu’une reconnaissance et une capture en temps réel des photos des documents pour un traitement sur mobile ou en back-office. ABBYY Mobile Capture comprend une fonctionnalité prête à l’emploi qui permet d’extraire des champs importants de certains documents spécifiques.

    L’éditeur dispose donc d’une expérience assez solide dans le domaine.

    L’inscription et la participation sont gratuites.

    S'inscrire gratuitement
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  2. #2
    Chroniqueur Actualités

    ABBYY va donner une introduction à la classification automatique
    Webinaires sur les technologies derrière la Digital Intelligence : ABBYY va donner une introduction à la classification automatique,
    ce 16 avril à 14H00 CEST

    ABBYY a préparé une série de webinaires à l’intention des développeurs pour les familiariser avec les technologies derrière la Digital Intelligence. Le premier, qui a eu lieu le 9 avril, était une introduction au NPL (Natural Language Processing, ou traitement automatique du langage naturel) et au Machine Learning. Le second, qui aura lieu le jeudi 16 avril 2020 à 14H00 CEST, propose une introduction à la classification automatique.

    Le classement automatique ou classification supervisée est la catégorisation algorithmique d'objets. Elle consiste à attribuer une classe ou catégorie à chaque objet (ou individu) à classer, en se basant sur des données statistiques. Elle fait couramment appel à l'apprentissage automatique et est largement utilisée en reconnaissance de formes.

    La classification (clustering) est donc une méthode mathématique d’analyse de données : pour faciliter l’étude d’une population d’effectif important, on les regroupe en plusieurs classes de telle sorte que les individus d’une même classe soient le plus semblables possible et que les classes soient le plus distinctes possible. Pour cela il y a diverses façons de procéder (qui peuvent conduire à des résultats différents).

    On cherche souvent des groupes homogènes c’est-à-dire où les objets sont ressemblant à l’intérieur d’un même groupe. Les méthodes de classification se distinguent entre autres par la structure de classification obtenue (partition, recouvrement, hiérarchie, pyramide). Ces techniques peuvent être utilisées dans de nombreux domaines comme :
    • le domaine médical : regrouper des patients afin de définir une thérapeutique adaptée à un type particulier de malades ;
    • le domaine du marketing, afin de définir un groupe cible d’individus pour une campagne publicitaire.



    En anglais, le terme désignant les méthodes de classification automatique est Clustering. En Intelligence Artificielle on parle d’Apprentissage non supervisé. En général, nous pouvons parler de classification automatique si aucune information n’est disponible concernant l’appartenance de certaines données à certaines classes connues a priori. Par ailleurs, le nombre de groupes recherchés peut être connu a priori ou non.

    Une première distinction entre méthodes de classification automatique peut être faite suivant leur objectif. La plupart des méthodes visent à obtenir un partitionnement des données, comme dans l’exemple suivant, plus éventuellement à trouver une donnée « représentative » (« prototype ») par groupe.

    Dans son invitation aux professionnels de l’informatique, ABBYY explique que « La technologie neuronale de classification automatisée des documents permet de classer les documents par contenu, aspect ou type. Venez découvrir comment configurer ABBYY FlexiCapture afin de vous permettre de répondre à cette problématique en quelques minutes ».

    L’inscription et la participation sont gratuites.

    S'inscrire gratuitement
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  3. #3
    Chroniqueur Actualités

    Webinaires sur les technologies derrière la Digital Intelligence
    Webinaires sur les technologies derrière la Digital Intelligence :
    ABBYY va donner une introduction à l'interface de vérification dans le Machine Learning ce 28 avril à 14H00 CEST

    ABBYY a préparé une série de webinaires à l’intention des développeurs pour les familiariser avec les technologies derrière la Digital Intelligence. Le premier, qui a eu lieu le 9 avril, était une introduction au NPL (Natural Language Processing, ou traitement automatique du langage naturel) et au Machine Learning. Le second, qui a eu lieu le jeudi 16 avril 2020 à 14H00 CEST, a proposé une introduction à la classification automatique. Cette fois-ci, ABBYY propose une introduction à l’interface de vérification et de Machine Learning.

    L'apprentissage automatique (ou Machine Learning - ML) est un terme général qui englobe une large classe d'algorithmes qui s'appuient sur les données. Ceci est utile dans les applications où l'algorithme est nécessaire pour s'adapter à de nouvelles situations en cours de fonctionnement, ou lorsqu'il serait trop compliqué d'écrire à la main la fonctionnalité exprimée par l'algorithme. Avec l’utilisation de plus en plus répandue du big data due à de meilleurs matériels et à Internet, les algorithmes d'apprentissage automatique qui peuvent utiliser ces données sont également devenus plus populaires. Ils peuvent être trouvés dans un large éventail d'applications, du filtrage des stocks de spam à la négociation par actions, et le domaine continue de croître. Les spécialistes estiment qu’à l'avenir, cette discipline devrait nous guider vers un monde d'autonomie avec des systèmes cyber-physiques contrôlés par l’apprentissage automatique qui pourront remplacer les conducteurs (voitures autonomes), les pilotes et plus encore.

    Il faut noter que l’apprentissage automatique ne se résume pas à un ensemble d'algorithmes mais suit une succession d'étapes :
    • L'acquisition de données : l'algorithme se nourrissant des données en entrée, c'est une étape importante. Il en va de la réussite du projet, de récolter des données pertinentes et en quantité suffisante.
    • La préparation et le nettoyage de la donnée : les données recueillies doivent être retouchées avant utilisation. En effet, certains attributs sont inutiles, d’autres doivent être modifiés afin d’être compris par l’algorithme, et certains éléments sont inutilisables car leurs données sont incomplètes. Plusieurs techniques telles que la visualisation de données, la transformation de données ou encore la normalisation sont alors employées.
    • La création du modèle.
    • L'évaluation : une fois l'algorithme d'apprentissage automatique entraîné sur un premier jeu de données, on l'évalue sur un deuxième ensemble de données afin de vérifier que le modèle ne fasse pas de surapprentissage.
    • Le déploiement : le modèle est déployé en production pour faire des prédictions, et potentiellement utiliser les nouvelles données en entrée pour se ré-entraîner et être amélioré.



    Alors que les tests traditionnels peuvent être suffisants pour des logiciels plus conventionnels, ils sont insuffisants pour les logiciels d'IA complexes, principalement parce que la gamme de situations à tester est incomparablement plus grande. Un programme intelligent typique incorpore implicitement des réponses à un très grand espace d'entrées possibles. L'état interne du programme est généralement énorme, alloué dynamiquement et peut impliquer des structures de données complexes (connaissances, règles, théories). Les systèmes d'IA peuvent impliquer plusieurs composants simultanés, ou d'autres sources de non-déterminisme. En raison de tous ces facteurs, une suite de tests ne peut exercer qu'une partie très limitée des configurations possibles, et il est très difficile d'évaluer combien a été découvert et donc de mesurer le risque résiduel d'erreurs.

    En clair, le problème central de la vérification logicielle est de vérifier qu'un système donné satisfait ses spécifications. Les techniques conventionnelles s’appuient sur des tests approfondis. La faiblesse de baser uniquement la vérification sur les tests est que « les tests de programme peuvent être utilisés pour montrer la présence de bogues, mais jamais pour montrer leur absence ». De plus en plus, les techniques de vérification basées sur des méthodes formelles sont acceptées dans l'industrie.

    Bien entendu, des exemples concrets seraient beaucoup plus illustratifs. Aussi, ABBYY propose de donner une introduction à l’interface de vérification de Machine Learning. L’éditeur invite les développeurs ce mardi 28 avril 2020 à 14H dans son webinaire qui sera consacré à cette étape dans le projet d’apprentissage automatique : « venez découvrir l’interface utilisateur ABBYY et l’ensemble de ses fonctionnalités ». La participation au webinaire est gratuite.

    S'inscrire gratuitement

    Regarder le replay des sessions précédentes :

    Introduction au traitement automatique du langage naturel et au Machine Learning
    Introduction à la classification automatique
    Introduction à l'extraction de données
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  4. #4
    Chroniqueur Actualités

    Webinaires sur les technologies derrière la Digital Intelligence
    Webinaires sur les technologies derrière la Digital Intelligence :
    ABBYY va donner une introduction à la création de projets de facture en s'appuyant sur l'IA ce 7 mai à 11H00 CEST

    ABBYY a préparé une série de webinaires à l’intention des développeurs pour les familiariser avec les technologies derrière la Digital Intelligence. Le premier, qui a eu lieu le 9 avril, était une introduction au NPL (Natural Language Processing, ou traitement automatique du langage naturel) et au Machine Learning. Le second, qui a eu lieu le jeudi 16 avril 2020 à 14H00 CEST, a proposé une introduction à la classification automatique. Le troisième était une introduction à l’extraction de données et le quatrième une introduction à l'interface de vérification dans le Machine Learning.

    Pour le dernier webinaire de cette série, ABBYY a choisi une introduction à la création des projets de facture qui va s’appuyer sur l’IA et le Machine Learning. Pierre Hagot, Partner Account Manager ABBYY et Olivier Vasseur, Solution Architect ABBY, les hôtes de cette session, vont se servir d’ABBYY FlexiCapture tout le long de leur exposé.

    Pourquoi avoir choisi cette technologie ? Notons que la gamme de technologie FlexiCapture se décompose en trois grandes parties, une instance distribuée, un service Cloud et le SDK. Cette technologie permet de récupérer n’importe quel type de document (carte d’identité, Avis d’imposition, Factures, Carte Vital, Lettre, Contrat,…) de les classifier et d’en extraire des informations particulières sur la base de règles qui auront été définies, vérifier ces documents et les exportés.


    FlexiCapture se positionne comme le meilleur outil du marché en matière de data capture grâce à l’intégration d’algorithme basé sur l’intelligence artificielle permettant une maximisation de certaines fonctionnalités clés comme :
    • Capture des données pour tous types de documents : ABBYY FlexiCapture SDK fournit les outils capables d’extraire les données des formulaires figés, ainsi que des documents semi-structurés et non structurés. Toutes les données requises peuvent être rapidement localisées et extraites dans le format approprié.
    • Traitement des factures prêt à l’emploi : FlexiCapture SDK fournit des Projets clé en main pour le traitement des factures. Les champs principaux sont tout de suite extraits, sans qu’aucune configuration supplémentaire ne soit nécessaire.
    • Paramétrage basé sur l’API : l’API de FlexiCapture SDK permet aux développeurs de paramétrer les procédures en partant de zéro ou de peaufiner une procédure existante sans avoir recours à des outils visuels. Par exemple, ils peuvent créer des définitions de projets et de documents, puis les utiliser pour traiter des documents et exercer le système. Ils peuvent aussi développer leurs propres outils pour administrer les projets FlexiCapture.
    • Classification avancée des documents : la classification intégrée des documents permet aux développeurs de créer à partir de zéro un outil de classification, de l’exercer grâce aux résultats de la vérification et de mettre en œuvre l’autoapprentissage pour améliorer la précision des résultats.
    • Apprentissage grâce au retour d’information : FlexiCapture SDK permet aux développeurs de mettre en place un apprentissage pour les procédures d’extraction des champs et de classification. Alimentée par le retour d’information fourni par l’utilisateur, cette technologie améliore considérablement la précision de l’extraction des champs et de la classification.
    • Bibliothèque d’échantillons de code : un ensemble complet d’échantillons de codes explique comment programmer l’utilisation du SDK. Chaque section de la bibliothèque possède des extraits de code accompagnés de consignes pas-à-pas sur la façon d’effectuer telle ou telle tâche. Les développeurs peuvent également réutiliser les échantillons de code dans leurs programmes.

    Les développeurs sont invités ce jeudi 7 mai 2020 à 11H00 CEST à participer gratuitement.

    S'inscrire gratuitement

    Regarder le replay des sessions précédentes :

    Introduction au traitement automatique du langage naturel et au Machine Learning
    Introduction à la classification automatique
    Introduction à l'extraction de données
    Introduction à l'interface de vérification dans le Machine Learning
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

###raw>template_hook.ano_emploi###