IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

extraction de terme


Sujet :

Langage Perl

  1. #1
    Membre averti
    Inscrit en
    Décembre 2004
    Messages
    48
    Détails du profil
    Informations forums :
    Inscription : Décembre 2004
    Messages : 48
    Par défaut extraction de terme
    Bonjour,

    je dispose autant de fichiers que de textes composant le corpus, un fichier pour chaque texte regroupant les termes du texte.
    mon texte est sous la forme :
    [NP tHwl/NN tAryxy/JJ] [PP fy/IN] [NP mkAfHp/NN] .
    je veux par ces NP et avoir en sortie le fichier suivant:

    Termes D1...........Dn
    [NPtHwl/NN tAryxy/JJ] freq1 ...... freqN
    .
    .
    etc
    où D1 à Dn sont les documents et freq1.. freqN est la frequence par du [NPtHwl/NN tAryxy/JJ] dans le document 1 par exemple.

    Comment puis-je faire pour programmer ça en Perl?
    Pouvez-vous m'aider

  2. #2
    Membre Expert

    Homme Profil pro
    Inscrit en
    Juillet 2003
    Messages
    2 075
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Ardennes (Champagne Ardenne)

    Informations forums :
    Inscription : Juillet 2003
    Messages : 2 075
    Par défaut
    Bonjour
    J'ai pas très bien compris ce que tu veux faire. As tu déjà une idée de l'algorithme?
    Pourrais tu représenter le cas clairement? D'après ce que j'ai compris tu as un certain nombre de textes qui compose un corpus. Dans ces textes tu dois chercher des termes par (?il manque un mot la dans ton texte ligne peut être?) dans les textes et en indiquer la fréquence c'est ça?
    Tu pourrais être juste un poil plus clair sur le problème qui t'est posé, n'oublie pas la capacité d'exposer clairement un problème, c'est la moitié du chemin fait vers la solution

  3. #3
    Responsable Perl et Outils

    Avatar de djibril
    Homme Profil pro
    Inscrit en
    Avril 2004
    Messages
    19 822
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Avril 2004
    Messages : 19 822
    Par défaut
    c'est pas tres clair, de plus tu ne proposes aucun code, allez au boulot et soit plus explicite

  4. #4
    Membre averti
    Inscrit en
    Décembre 2004
    Messages
    48
    Détails du profil
    Informations forums :
    Inscription : Décembre 2004
    Messages : 48
    Par défaut
    Citation Envoyé par Gnux
    Bonjour
    J'ai pas très bien compris ce que tu veux faire. As tu déjà une idée de l'algorithme?
    Pourrais tu représenter le cas clairement? D'après ce que j'ai compris tu as un certain nombre de textes qui compose un corpus. Dans ces textes tu dois chercher des termes par (?il manque un mot la dans ton texte ligne peut être?) dans les textes et en indiquer la fréquence c'est ça?
    Tu pourrais être juste un poil plus clair sur le problème qui t'est posé, n'oublie pas la capacité d'exposer clairement un problème, c'est la moitié du chemin fait vers la solution
    Désolé je m'explique pas trés bien.
    Je dispose d'autant de fichiers que de textes composant le corpus, 1 fichier pour chaque texte, regroupant tous les termes de ce texte.

    mon fichier texte est sous la forme :
    [NP tHwl/NN tAryxy/JJ] [PP fy/IN] [NP mkAfHp/NN] .
    je veux indexer par ces NP et avoir en sortie une matrice sous la forme suivante dans un fichier :

    Termes D1...........Dn
    [NPtHwl/NN tAryxy/JJ] freq11 ...... freqN1
    [NP mkAfHp/NN] freq22....... freqN2
    .
    etc

    où les lignes sont les [NP] et les colonnes sont les documents.
    où D1 à Dn sont les documents et freq11 est la frequence du [NPtHwl/NN tAryxy/JJ] dans le document 1 par exemple.

    Comment puis-je faire pour programmer ça en Perl?
    Pouvez-vous m'aider

Discussions similaires

  1. Extraction de mots clés
    Par Olive1808 dans le forum Algorithmes et structures de données
    Réponses: 6
    Dernier message: 01/02/2016, 20h49
  2. [RDF] Extraction des concepts pour un terme à partir d'une ontologie ODP
    Par khaled87 dans le forum Ontologies
    Réponses: 0
    Dernier message: 05/03/2014, 10h11
  3. Réponses: 0
    Dernier message: 09/06/2009, 13h15
  4. extraction termes lecture fichier
    Par anthonystaltaro dans le forum Général Python
    Réponses: 2
    Dernier message: 08/06/2009, 12h40
  5. Réponses: 2
    Dernier message: 22/07/2002, 18h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo