IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Documents Java Discussion :

Création Parseur de CV


Sujet :

Documents Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Inscrit en
    Décembre 2009
    Messages
    13
    Détails du profil
    Informations forums :
    Inscription : Décembre 2009
    Messages : 13
    Par défaut Création Parseur de CV
    Bonjour,

    Je veux créer un parseur de CV qui permet d'extraire toutes les informations ( Titre du CV ,Civilité ,Prénom ,Nom ,Date de naissance ,Adresse ,Ville ,Expériences,Formations.....) depuis un document word ou pdf.
    J'ai pu faire la reherche avec pattern (j'utilise java) mais dans la plupart des cas les informations récupérées sont incorrectes.
    je veux une API pour m'aider à faire une extraction des informations .

  2. #2
    Expert éminent
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 482
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 482
    Par défaut
    Incorrecte comment.


    Si tes CVs ne sont pas standardisés, j'ai peur que ce soit peine perdue


    J'ai déjà reçus pas mal de CV et sur certains, même avec mon cerveau, pour certains, je n'arrive pas toujours à savoir tellement c'est mélangé n'mporte comment

  3. #3
    Membre averti
    Inscrit en
    Décembre 2009
    Messages
    13
    Détails du profil
    Informations forums :
    Inscription : Décembre 2009
    Messages : 13
    Par défaut
    Merci pour votre réponse,
    Au debut j'ai creer un parseur sur les Cv standardisés ca marche, mais moi je veut aussi qu'il puisse trouver méme 50% des informations avec les Cv non standardisés ,donc je veut juste des API ou autres pour m'aider a resoudre le probléme

  4. #4
    Expert éminent
    Avatar de tchize_
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Avril 2007
    Messages
    25 482
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Belgique

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Avril 2007
    Messages : 25 482
    Par défaut
    Il n'y a pas 36.000 api, si tu arrive déjà à lire tes CVS standardisé, les méthodes sont les même: extraire le texte et la structure du document à partir de ces apis (itext pour pdf, je ne sais pas ce que tu as utilisé pour word), et puis comparer avec des chaines de caractères précises pour identifier les sections. Genre si tu li expérience, expériences, expérience(s), tu a de forte chance que la structure qui suit derrière soit l'expérience de la personne. Si le texte patch un truc de style xx/xx/xxxx tu as de fortes chances que ce soit une date.

    Dans tout les cas tu va devoir chipoter et bidouiller jusqu'à arriver à un résultat convenable.

  5. #5
    Membre averti
    Inscrit en
    Décembre 2009
    Messages
    13
    Détails du profil
    Informations forums :
    Inscription : Décembre 2009
    Messages : 13
    Par défaut
    Citation Envoyé par tchize_ Voir le message
    Il n'y a pas 36.000 api, si tu arrive déjà à lire tes CVS standardisé, les méthodes sont les même: extraire le texte et la structure du document à partir de ces apis (itext pour pdf, je ne sais pas ce que tu as utilisé pour word), et puis comparer avec des chaines de caractères précises pour identifier les sections. Genre si tu li expérience, expériences, expérience(s), tu a de forte chance que la structure qui suit derrière soit l'expérience de la personne. Si le texte patch un truc de style xx/xx/xxxx tu as de fortes chances que ce soit une date.

    Dans tout les cas tu va devoir chipoter et bidouiller jusqu'à arriver à un résultat convenable.
    Merci pour votre rapide réponse,
    Moi j'utilise pour la conversion en text "Apache Tika" ce qui pose le probléme est la structure du CV par exemple:
    certain ecrit :
    'Nom et Prénom :' ,'Nom': et 'Prénom :' ,'directement Monprénom MONNOM' ca c'est le cas le plus simple mais il y d'autre plus compliquer
    donc je pense qu'il peut y avoir un chemin vers une autre solution plus efficase

  6. #6
    Modérateur

    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    12 582
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 12 582
    Par défaut
    Citation Envoyé par fghi1 Voir le message
    donc je pense qu'il peut y avoir un chemin vers une autre solution plus efficase
    Oui, un réseau de neurones, auquel tu fournirais genre 1000 CVs réels en lui apprenant comment les lire, et à partir de là il saurait comment on lit un CV et pourrait faire tous les autres à ta place.

    Plus efficace, mais passablement plus fastidieux.
    N'oubliez pas de consulter les FAQ Java et les cours et tutoriels Java

Discussions similaires

  1. Classe pour la création d'un graphe xy
    Par Bob dans le forum MFC
    Réponses: 24
    Dernier message: 03/12/2009, 17h20
  2. [Kylix] Création d'un fichier lien
    Par DrQ dans le forum EDI
    Réponses: 2
    Dernier message: 14/05/2002, 21h30
  3. Création image BMP
    Par Anonymous dans le forum C
    Réponses: 2
    Dernier message: 25/04/2002, 16h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo