IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

procédure pour une classification par domaine


Sujet :

Python

  1. #1
    Membre du Club
    Inscrit en
    Novembre 2010
    Messages
    221
    Détails du profil
    Informations forums :
    Inscription : Novembre 2010
    Messages : 221
    Points : 61
    Points
    61
    Par défaut procédure pour une classification par domaine
    Bonsoir,
    j'ai un ensemble de texte et je dois faire une classification par domaine (par exemple dire ce texte est dans la catégorie sport ou medecine ... ), mais je sais pas comment procéder, qui pourra me donner la procédure a quivre pour une tel classification
    PS: j'utilise NLTK

  2. #2
    Expert éminent

    Homme Profil pro
    Inscrit en
    Octobre 2008
    Messages
    4 300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Octobre 2008
    Messages : 4 300
    Points : 6 780
    Points
    6 780
    Par défaut
    Salut,

    Est-ce-que les textes contiennent un élément qui permet d'identifier leur domaine ?

    Dois-tu faire une recherche par mots-clé dans ces texte pour parvenir à "deviner" leur domaine ?

    Un exemple, éventuellement ?

  3. #3
    Membre du Club
    Inscrit en
    Novembre 2010
    Messages
    221
    Détails du profil
    Informations forums :
    Inscription : Novembre 2010
    Messages : 221
    Points : 61
    Points
    61
    Par défaut
    1/ je travail sur les tweet posté sur tweeter
    2/ pour récolter les tweet j'utilise un mot clé, parfois plusieurs mot clés donc je peux avoir plusieurs domaine
    donc comment je peux reconnaitre le domaine de chaque tweet comment de dois procédé pour faire un traitement pour les classifié par domaine ?

  4. #4
    Membre émérite
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Janvier 2010
    Messages
    553
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Industrie

    Informations forums :
    Inscription : Janvier 2010
    Messages : 553
    Points : 2 740
    Points
    2 740
    Par défaut
    en gros, si je comprends bien: 1 domaine = 1 hashtag
    c'est ça?

  5. #5
    Expert éminent

    Homme Profil pro
    Inscrit en
    Octobre 2008
    Messages
    4 300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Belgique

    Informations forums :
    Inscription : Octobre 2008
    Messages : 4 300
    Points : 6 780
    Points
    6 780
    Par défaut
    C'est contradictoire ce que tu dis.
    2/ pour récolter les tweet j'utilise un mot clé, parfois plusieurs mot clés donc je peux avoir plusieurs domaine
    donc, il sont déjà classés par domaine, non ?

  6. #6
    Membre du Club
    Inscrit en
    Novembre 2010
    Messages
    221
    Détails du profil
    Informations forums :
    Inscription : Novembre 2010
    Messages : 221
    Points : 61
    Points
    61
    Par défaut
    non, sont pas classé, je peux utilisé par exemple deux mots clé par exempe big data et cancer du sang la j'ai deux domaine différents, donc je veux que chaque tweet sera classifié dans son domaine

  7. #7
    Membre émérite
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Janvier 2010
    Messages
    553
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Industrie

    Informations forums :
    Inscription : Janvier 2010
    Messages : 553
    Points : 2 740
    Points
    2 740
    Par défaut
    en fait je vois pas vraiment ou est le problème, ou en tout cas, la solution me parait excessivement simple.

    tu fais une recherche avec un ou plusieurs mot-clés qui constituent un domaine.
    tu obtiens des résultats.
    il suffit de créer le dommaine s'il n'existe pas déjà et lui assigner les résultat de la recherche.

    tu peux nous montrer ce que tu as déjà fait et nous expliquer plus précisément ou se situe ton problème?

  8. #8
    Membre du Club
    Inscrit en
    Novembre 2010
    Messages
    221
    Détails du profil
    Informations forums :
    Inscription : Novembre 2010
    Messages : 221
    Points : 61
    Points
    61
    Par défaut
    Bonjour, j'ai décidé de faire une catégorisation par apprentissage supervisé, donc j'ai besoin d'un corpus de test pour la classification par catégorie, ou puis-je trouver des corpus d'apprentissage svp
    merci

  9. #9
    Expert éminent sénior
    Homme Profil pro
    Architecte technique retraité
    Inscrit en
    Juin 2008
    Messages
    21 283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Manche (Basse Normandie)

    Informations professionnelles :
    Activité : Architecte technique retraité
    Secteur : Industrie

    Informations forums :
    Inscription : Juin 2008
    Messages : 21 283
    Points : 36 770
    Points
    36 770
    Par défaut
    Citation Envoyé par khadi8 Voir le message
    j'ai décidé de faire une catégorisation par apprentissage supervisé, donc j'ai besoin d'un corpus de test pour la classification par catégorie, ou puis-je trouver des corpus d'apprentissage svp
    Pourquoi ne pas regarder les corpus déjà présents dans NLTK et/ou d'aller dans des forums de traitement automatique du langage s'ils ne suffisent pas.
    - W
    Architectures post-modernes.
    Python sur DVP c'est aussi des FAQs, des cours et tutoriels

Discussions similaires

  1. dataset pour une classification par domaine
    Par khadi8 dans le forum Méthodes prédictives
    Réponses: 0
    Dernier message: 09/04/2014, 22h37
  2. [Client/Serveur] Comment procéder pour une validation par le Serveur ?
    Par wizad dans le forum Windows Presentation Foundation
    Réponses: 2
    Dernier message: 11/09/2008, 08h47
  3. Réponses: 0
    Dernier message: 01/07/2008, 10h58
  4. Quel type de poste pour une MIAGE par alternance?
    Par seb591 dans le forum Etudes
    Réponses: 4
    Dernier message: 09/08/2007, 19h55
  5. procédure pour une MAJ d'un formulaire à choix multiple
    Par Zen_Fou dans le forum SQL Procédural
    Réponses: 4
    Dernier message: 26/05/2006, 14h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo