Bonjour,
J’ai pour objectif de réaliser une application (c#, java, etc.) qui, à terme, sera capable de réaliser ces deux fonctions principales :
- Extraire le texte d’un fichier PDF ou d’une image via la méthode de l’OCR.
- Créer et enregistrer un modèle dans la base de données via les zones de sélections faites par l’utilisateur.
Pour visualiser au mieux ce que je compte faire, je vous propose un « schéma » de cette application :
Plus d’explications sur les zones :
Quand l’utilisateur se trouve face à la zone de texte généré par l’application (à droite dans l’exemple), il a alors le choix de sectionner n’importe quel « bout » de texte qui l’intéresse pour le modèle (ce que doit contenir le modèle en gros).
Dans l’exemple, il y aura dans le modèle une partie ‘titre’, ‘auteur’, etc.
Le but étant par la suite de générer automatiquement le modèle (car il y a plusieurs PDF).
Voici ma question :
Quel langage est le mieux adapté à a réalisation de ce type d’application ? (j’avais déjà pensé au C# mais la sélection de zone par l’utilisateur me pose problème car je ne vois pas comment faire).
Mon principal problème étant cette fameuse « sélection » (qui ouvre une fenêtre contenant la sélection et un champ vide à remplir par l’utilisateur, par exemple ‘titre’).
Merci par avance de votre aide ! =)
Partager