IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langages de programmation Discussion :

Comment développer des scrapers OCR ?


Sujet :

Langages de programmation

  1. #1
    Membre à l'essai
    Femme Profil pro
    Experte agréée en gestion de projet web sur www.webagency321.com
    Inscrit en
    Avril 2016
    Messages
    31
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 54
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Experte agréée en gestion de projet web sur www.webagency321.com

    Informations forums :
    Inscription : Avril 2016
    Messages : 31
    Points : 20
    Points
    20
    Par défaut Comment développer des scrapers OCR ?
    Bonjour,

    Je cherche à acquérir ou faire développer un logiciel me permettant à mon tour (moi qui ne sait pas coder) de créer des petites applis d'OCR scraping (plus de détail sur mon besoin ci-dessous - en anglais, désolée).
    J'ai vu sur internet l'existence d'uipath qui semble se rapprocher de mon besoin, mais je ne suis pas sûre et ils ne semblent pas pressés de répondre aux questions qu'on leur pose.
    Je voudrais des conseils si des gens s'y connaissent ou ont déjà fait ce genre de choses.
    Notamment si quelqu'un connaît des logiciels permettant de faire cela.

    Merci

    Nicole

    PS :
    I want to be able to build OCR scrapers which are able to :

    1. automatically detect when predetermined softwares are running on a computer (examples of softwares we need to scrap : web browsers, or any software window like for example word, a media player, powerpoint, a gaming software or whatever...). It should be able to detect when this window is moved in the user's screen and follow it. Sometimes a window can temporarily hide or overlap the scanned window : our scraper must be able to deal with these situations and continue scanning even in this case.
    2. when it has detected one of the predetermined software is running, it should automatically open one specific excel files to export the data.
    3. do an OCR scan of this window in real time and when a predetermined event happens in the scanned window, launch an extraction of the data (in a timelapse faster than 1 second since the predetermined event happened)
    4. the data might be : text, numbers, OCR recognition of images, or simply the colour of predetermined pixels in the window.
    5. extract the information and paste it into specific cells of an opened excel sheet. (please, let me know the other destination output formats your softwares allows).
    6. call a macro in the excel output file after each pasting.
    7. save a copy of each pasting in excel files stored in a determined directory (this action should not require to open excel when a new copy must be saved and stored, it should be done in the background).
    8. several scrapers should be able to work at the same time on the same computer. For example, a situation with 2 scrapers extracting data from a gaming software + 1 scraper extracting the subtitles from a movie on VLC at the same time should be possible.

    So I need a solution allowing me to build such customed scrapers.

  2. #2
    Membre expérimenté
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2004
    Messages
    374
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : Belgique

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2004
    Messages : 374
    Points : 1 399
    Points
    1 399
    Par défaut
    Intéressant ... Je me demande s'il est légal d'installer ce genre de soft sur l'ordinateur d'un employé en France ou en Belgique.

    En tout cas, ce qui est sûr, c'est que l'employé doit être au courant et que si une entreprise m'annonçait qu'elle avait recours à ce logiciel, je refuserai d'y travailler :-)

    Bon par contre désolé, je n'ai pas de réponse à ta question ;-)

  3. #3
    Membre à l'essai
    Femme Profil pro
    Experte agréée en gestion de projet web sur www.webagency321.com
    Inscrit en
    Avril 2016
    Messages
    31
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 54
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Experte agréée en gestion de projet web sur www.webagency321.com

    Informations forums :
    Inscription : Avril 2016
    Messages : 31
    Points : 20
    Points
    20
    Par défaut
    Voici un post qui peut permettre d'ouvrir un débat, mais je te propose de créer une discussion à part entière à ce sujet, parce que là, c'est complètement hors sujet.

    1. il ne s'agit pas de fliquer des employés.
    2. il s'agit de mettre en place des outils permettant à des travailleurs d'automatiser des tâches abrutissantes.
    3. je ne suis ni en France ni en Belgique.

  4. #4
    Membre expérimenté
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2004
    Messages
    374
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : Belgique

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2004
    Messages : 374
    Points : 1 399
    Points
    1 399
    Par défaut
    S'il s'agit d'automatiser des tâches, alors AutoIt (https://www.autoitscript.com/site/autoit/) fait ça très bien, mais ça ne fonctionne que sous Windows :-)

  5. #5
    Membre à l'essai
    Femme Profil pro
    Experte agréée en gestion de projet web sur www.webagency321.com
    Inscrit en
    Avril 2016
    Messages
    31
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 54
    Localisation : France, Gironde (Aquitaine)

    Informations professionnelles :
    Activité : Experte agréée en gestion de projet web sur www.webagency321.com

    Informations forums :
    Inscription : Avril 2016
    Messages : 31
    Points : 20
    Points
    20
    Par défaut
    Citation Envoyé par Shepard Voir le message
    S'il s'agit d'automatiser des tâches, alors AutoIt (https://www.autoitscript.com/site/autoit/) fait ça très bien, mais ça ne fonctionne que sous Windows :-)
    Bonjour Shepard,

    Merci pour l'info.

    Si je comprends bien, Autoit permet d'automatiser des actions, n'est-ce pas, comme autohotkey je pense.

    Mon projet repose sur 3 temps :
    1. état des lieux de ce qui se passe au sein de l'interface d'un logiciel tierce et copie des infos importantes sous excel
    2. process des infos sous excel et calcul des tâches à réaliser
    3. automatisation des tâches à réaliser

    Mon post dans ce forum concerne l'étape 1 : état des lieux de ce qui se passe au sein de l'interface d'un logiciel tierce et copie des infos importantes sous excel.

    Ce qui implique de scraper l'interface du logiciel et d'en exporter ce qui m'intéresse.

    Sais-tu si Autoit permet de faire cela? A première lecture de leur site web, je n'ai pas cette impression, mais peut-être que je me trompe.

  6. #6
    Membre expérimenté
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2004
    Messages
    374
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : Belgique

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Juin 2004
    Messages : 374
    Points : 1 399
    Points
    1 399
    Par défaut
    La dernière fois que je l'ai utilisé c'était il y a pas mal d'années, mais si je me souviens bien il y a un logiciel inclu dans la distribution qui permet de savoir diverses infos pendant le développement, notamment la classe d'un widget, la position absolue et relative par rapport à l'application du curseur de la souris, etc.

    Ce dont tu me parles me semble tout à fait faisable avec autoit, mais je m'inquiète par contre pour les performances. Démarrer Excel et y mettre des infos prends du temps, de plus ça pourrait gêner l'utilisateur qui verra la fenêtre Excel se mettre à l'avant-plan (pendant 1/10è de seconde mais ça se voit quand même ...)

    En tout cas, je ne le recommande pas si les machines sur lesquelles éxécuter ce soft n'a pas de SSD

Discussions similaires

  1. Réponses: 8
    Dernier message: 07/06/2015, 11h45
  2. Réponses: 0
    Dernier message: 02/02/2015, 09h26
  3. [Browsers] Comment développer des plugins et add-ons
    Par Lucas Panny dans le forum Internet
    Réponses: 5
    Dernier message: 14/03/2009, 18h17
  4. [D2005]Comment utiliser des assembly développées en delphi
    Par Valéry dans le forum Delphi .NET
    Réponses: 1
    Dernier message: 16/08/2005, 19h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo