IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

apprentissage et les algorithme utilisés


Sujet :

Méthodes prédictives

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Juillet 2008
    Messages
    29
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2008
    Messages : 29
    Par défaut apprentissage et les algorithme utilisés
    Bonjour tout le monde;

    j'ai un projet en apprentissage supervisée dans le but de traiter des jeux de données et je dois choisir 2 parmi 4 méthodes de l'apprentissage et comparer les résultats obtenus.

    ces méthodes sont les suivantes:
    (a) K-plus proches voisins
    (b) Analyse discriminante linéaire
    (c) Régression logistique
    (d) Arbres de décision

    Est ce que vous avez une idée comment je peux choisir les meilleurs méthodes?

    Merci d'avance.

  2. #2
    Alp
    Alp est déconnecté
    Expert confirmé

    Avatar de Alp
    Homme Profil pro
    Inscrit en
    Juin 2005
    Messages
    8 575
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations forums :
    Inscription : Juin 2005
    Messages : 8 575
    Par défaut
    Il faudrait plus de détails ...

    Que représenteront les données ?
    Que devra en faire l'algorithme ?
    Quelle est l'ordre de grandeur de la quantité de données ?

  3. #3
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Bonjour,

    note qu'a part les kPPV, tu proposes des méthodes linéaires... As tu un problème linéaire ?
    As tu regardé tes données au préalable ?
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  4. #4
    Membre averti
    Profil pro
    Inscrit en
    Juillet 2008
    Messages
    29
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2008
    Messages : 29
    Par défaut apprentissage et algorithmz utilisé
    le langage de programmation est R, un peu proche de matlab, et les donnée sont les suivants
    (effectuer 2 algorithmes pour chaque données)
    donnée crabs:

    library(MASS)
    data(crabs)
    Crabs$data <- crabs[,4:8]

    données voyelles:
    un ensemble de mesures éffectuées lors de la prononciation des voyelles par différents locuteurs.

    sachant que les locuteurs dans l'ensemble d'apprentissage ne sont pas les mêmes dans l'ensemble de test.
    sinon comment on peux choisir une méthode si on a des variables quantitatifs ou qualitatifs?

  5. #5
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Bonjour,

    il me semble que les méthodes que tu cites s'en sortent bien avec ces deux types de variables (j'en suis sûr pour kPPV, RL et presque certain pour les arbres).

    Pour ce qui est de choisir les deux meilleures méthodes, on a souvent du mal avant de les tester (au moins grossièrement). Au plus tu auras certaines intuitions.
    Pour un problème comme le tien, j'ai un doute pour les kPPV. Cette méthode est bien si les données sont particulièrement bien regroupées dans l'espace des caractéristiques. Sinon...
    J'ai un faible pour la régression logistique qui est une méthode dont la puissance est reconnue et de plus en plus utilisée au détriment de l'analyse discriminante car elle offre plus de souplesse et d'avantage.

    Je te conseille quand même de commencer par faire une étude de tes données (c'est la base de tout travail de classification) : distribution, analyse mono variable, corrélations, ...
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  6. #6
    Membre averti
    Profil pro
    Inscrit en
    Juillet 2008
    Messages
    29
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2008
    Messages : 29
    Par défaut
    Bonjour,

    Est ce que vous connaissez un lien d'internet, pour bien comprendre comment procéder vers un exemple peut être, parce que là, ce n'est pas très clair, je suis débutante dans ce domaine et je ne sais pas ce que vous vouliez dire par "étudier les données"!!

    Merci

  7. #7
    Membre éprouvé
    Avatar de Rakken
    Homme Profil pro
    Inscrit en
    Août 2006
    Messages
    1 257
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Août 2006
    Messages : 1 257
    Par défaut
    Après, le but de l'exercice n'est visiblement pas de trouver les deux meilleures méthodes (sinon, il faudrait effectivement faire un test, même minimal, sur les quatres), c'est juste d'en tester deux pour les comparer.
    Le meilleur choix est peut-être encore de prendre les deux méthodes les plus éloignées l'une de l'autre en terme de fonctionnement, où celles qui sont les plus succeptibles de se retrouver dans d'autres problèmes, non ?

  8. #8
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Bonjour,

    Citation Envoyé par hakemass Voir le message
    Est ce que vous connaissez un lien d'internet, pour bien comprendre comment procéder vers un exemple peut être, parce que là, ce n'est pas très clair, je suis débutante dans ce domaine et je ne sais pas ce que vous vouliez dire par "étudier les données"!!
    Je l'ai marqué au dessus. Je te conseille de regarder comment sont réparties les données et surtout de voir si tu peux les caractériser. Est ce que tu saurais faire le travail à la main ?, ...

    Sinon le meilleur livre sur la Data Mining est sans aucun doute (à mon sens) : "Data Mining et statistique décisionnelle" de Stéphane Tufféry.
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

Discussions similaires

  1. Réponses: 0
    Dernier message: 05/11/2013, 12h20
  2. Apprentissage en utilisant les algorithmes génétiques
    Par shadow07 dans le forum Algorithmes et structures de données
    Réponses: 4
    Dernier message: 23/05/2011, 07h56
  3. [Débutant] les algorithmes utilisés par la fonction solve
    Par rafrouf2010 dans le forum MATLAB
    Réponses: 3
    Dernier message: 18/02/2011, 14h47
  4. Logiciel permettant de connaitre les fichiers utilisés
    Par Mut dans le forum Autres Logiciels
    Réponses: 3
    Dernier message: 14/02/2004, 17h19
  5. recherches des cours ou des explications sur les algorithmes
    Par Marcus2211 dans le forum Algorithmes et structures de données
    Réponses: 6
    Dernier message: 19/05/2002, 22h18

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo