IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

Votre avis sur le classement supervisé


Sujet :

Méthodes prédictives

  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2008
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2008
    Messages : 17
    Par défaut Votre avis sur le classement supervisé
    Bonjour,
    je suis actuellement en stage de fin d'étude de DUT GEII.

    On m'a demandé de créer un module de classement supervisé qui sera, plus tard, intègré à un logiciel de récupération de donnée sur internet.
    Le cahier des charges requiert pour un server de récupérer divers articles sur internet, déterminer la langue de l'article traité, classer les articles dans les catégories (crée manuellement) les plus judicieuses, et ensuite, les stocker dans une base de données (MySQL).

    Le server doit-être capable de traiter 40000 articles ET (fallait si attendre) doit-être le plus rapide possible, je ne sais pas précisément combien de temps cela indique, mais le server doit pouvoir répondre aux demandent de connexion à la base mise-à-jour, pas plus de 1h je suppose.

    Je me place donc dans la partie "classement des articles par catégories", et je voulais avoir vos avis et conceils sur l'algorithme de classement supervisé que vous jugé le plus apte à être employé, je n'ai jamais touché aux domaines de l'IA mais je suis prêt à m'y plonger sérieusement, le projet doit-être réalisé en 2 mois, ou facilement réutilisable.

    Je vous remercie d'avance.

  2. #2
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Bonjour,

    si tu veux t'intéresser au domaine, commence donc pas lire la "bible" écrite par Stéphane Tufféry : Data Mining et Statistiques Décisionnelles. Si tu ne veux pas l'acheter, il est présent dans les Google Books.

    Plus que de choisir une "bonne" méthode de classement, je te conseille de commencer par travailler sur l'extraction de BONS descripteurs !
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  3. #3
    Membre éprouvé Avatar de Bucketpc
    Inscrit en
    Août 2008
    Messages
    98
    Détails du profil
    Informations personnelles :
    Âge : 38

    Informations forums :
    Inscription : Août 2008
    Messages : 98
    Par défaut
    Bonjour,

    Tu dois lire sur la classification de documents textuels. Si vous n'avez aucune idée sur ça, je te conseille de commencer par voir comment se déroule le processus d'extraction des connaissances à partir des données, ensuite apprendre quelques méthodes de classification. Je dirais qu'il faut juste commencer par KPPv et la classification centrée, pour leur simplicité.

    Pour les document textuels, il s'agit de données non structurées. Donc, il faut faire la structuration d'abord. En d'autre termes, il faut mettre le texte sous forme d'un vecteur de poids.

  4. #4
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2008
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2008
    Messages : 17
    Par défaut
    Le Data Mining est-il bien adapté à se que je cherche à realiser ? Ma partie ne consite pas à répondre à la demande d'un utilisateur lors d'une recherche, mon objectif est de récupérer les articles placés dans une catégorie "inconnue", les lire et déterminer les quelles des catégories connues seraient les plus judicieuses en concordance avec le sujet des articles (placer un article sur les énergies renouvelables dans la catégorie énergie).

    je vais me renseigner sur les vecteurs de poids,

    merci à vous.

  5. #5
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Citation Envoyé par bambam978 Voir le message
    Ma partie ne consite pas à répondre à la demande d'un utilisateur lors d'une recherche, mon objectif est de récupérer les articles placés dans une catégorie "inconnue", les lire et déterminer les quelles des catégories connues seraient les plus judicieuses en concordance avec le sujet des articles (placer un article sur les énergies renouvelables dans la catégorie énergie).
    C'est la même chose !
    Que ce soit l'utilisateur qui souhaite classe un élément ou un robot sur internet qui récupère un article, le problème est le même.
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  6. #6
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2008
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2008
    Messages : 17
    Par défaut
    très bien, je suiverais vos conseils merci.

  7. #7
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2008
    Messages
    17
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2008
    Messages : 17
    Par défaut
    Bonjour,

    dans la suite de mon projet, j'en suis venu à découper mes textes en chaînes de mots après les avoir épurés des mots "vides". Je pense que l'analyse des chaînes de mots est plus pertinente que l'analyser de mots indépendants. Mes chaînes seront délimitées par les ponctuations du texte.

    Comment rendre l'analyse de chaînes de mots pertinentes ?

    Une des solutions envisagées est de rechercher les mots de cette chaîne dans le dictionnaire créer préalablement (dictionnaire de chaîne de mots également). Selon le nombre de mots identiques dans les deux chaînes, la chaîne du texte gagnerai plus ou moins d'importance dans la catégorie, se qui aura pour but de donner un niveau de pertinence pour chaque catégorie, la meilleur étant à la fin choisie.

    J'ai des doûtes sur l'efficacité final de mon projet. Pouvez-vous me conseiller ?

    Cordialement,
    Bam-Bam.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Donnez votre avis sur les articles de Developpez.com
    Par Geronimo dans le forum C++Builder
    Réponses: 13
    Dernier message: 14/01/2007, 22h00
  2. Donnez votre avis sur les articles de Developpez
    Par Anomaly dans le forum Contribuez
    Réponses: 37
    Dernier message: 29/05/2006, 21h48
  3. [Débat] Votre avis sur la section "Dev Web"
    Par Marc Lussac dans le forum Evolutions du club
    Réponses: 31
    Dernier message: 03/03/2004, 20h55
  4. Votre avis sur le schema Relax NG...
    Par Bj dans le forum Valider
    Réponses: 8
    Dernier message: 19/09/2003, 17h30
  5. Votre avis sur 1 livre SVP
    Par cab dans le forum DirectX
    Réponses: 4
    Dernier message: 17/09/2003, 10h39

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo