IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

[data mining] Réseau de neurones ou classification


Sujet :

Méthodes prédictives

  1. #1
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2007
    Messages
    200
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 200
    Par défaut [data mining] Réseau de neurones ou classification
    Bonjour,

    Je débute un peu dans le data mining. Et j'aimerais savoir comment se fait le choix entre un algo de classification et les réseaux de neurones.

    En gros j'ai un ensemble de variables en entrée (age, sexe,salaires, etc..) et je dois prédire une colonne en sortie (booléen décrivant si l'individu est acheteur ou pas) et apparement c'est l'algo de classification qui marche mieux que le réseau de neurones (tests réalisés sous sql server). Alors comment aurais-je pu choisir directement l'arbre de classification? Je suis preneur de tout type d'indication.

    J'aimerais juste comprendre comment se fait le choix entre les 2 algorithmes?
    PS: Dans mon message précédent au lieu d'algo de classification comprenez algo d'arbres de décision.
    D'avance merci.

  2. #2
    Expert confirmé
    Avatar de PRomu@ld
    Homme Profil pro
    Ingénieur de Recherche
    Inscrit en
    Avril 2005
    Messages
    4 155
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Ingénieur de Recherche
    Secteur : Enseignement

    Informations forums :
    Inscription : Avril 2005
    Messages : 4 155
    Par défaut
    En fait quand tu parles de méthode de classification et de réseaux de neurones, c'est assez vague.

    De quelle méthode de classification parles-tu ? K-Means ? Approche Bayésienne ?

    De plus, les réseaux de neurones sont des outils qui permettent de faire une classification, c'est donc clairement un outils de classification.

    Bref ta question est assez bizarre, il faut que tu détailles (beaucoup) plus pour qu'on puisse te répondre.

  3. #3
    Modérateur
    Avatar de ToTo13
    Homme Profil pro
    Chercheur en informatique
    Inscrit en
    Janvier 2006
    Messages
    5 793
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : Chercheur en informatique
    Secteur : Santé

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 793
    Par défaut
    Citation Envoyé par PRomu@ld Voir le message
    En fait quand tu parles de méthode de classification et de réseaux de neurones, c'est assez vague.

    De quelle méthode de classification parles-tu ? K-Means ? Approche Bayésienne ?

    De plus, les réseaux de neurones sont des outils qui permettent de faire une classification, c'est donc clairement un outils de classification.

    Bref ta question est assez bizarre, il faut que tu détailles (beaucoup) plus pour qu'on puisse te répondre.
    +1.
    Il est bien aussi de tester plusieurs algorithmes de classement : SVM, forêts aléatoires (mon préféré en ce moment), etc.
    Consignes aux jeunes padawans : une image vaut 1000 mots !
    - Dans ton message respecter tu dois : les règles de rédaction et du forum, prévisualiser, relire et corriger TOUTES les FAUTES (frappes, sms, d'aurteaugrafe, mettre les ACCENTS et les BALISES) => ECRIRE clairement et en Français tu DOIS.
    - Le côté obscur je sens dans le MP => Tous tes MPs je détruirai et la réponse tu n'auras si en privé tu veux que je t'enseigne.(Lis donc ceci)
    - ton poste tu dois marquer quand la bonne réponse tu as obtenu.

  4. #4
    Membre Expert
    Homme Profil pro
    Chercheur
    Inscrit en
    Mars 2010
    Messages
    1 218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Mars 2010
    Messages : 1 218
    Par défaut
    Bonjour,

    il faudrait préciser quelles sont les données, quel est l'arbre de décision utilisé et quel est le réseau de neurones utilisé. D'après mon expérience, les mauvais résultats obtenus avec les réseaux de neurones sont généralement dus à l'absence d'une démarche de sélection de modèle, notamment en ce qui concerne l'architecture (nombre de couches cachées, nombre de neurones par couche).

  5. #5
    Membre éclairé
    Inscrit en
    Janvier 2006
    Messages
    288
    Détails du profil
    Informations forums :
    Inscription : Janvier 2006
    Messages : 288
    Par défaut
    Bonjour,

    Aleph69, ayant vu vôtre réponse et particulièrement les propos : "D'après mon expérience, les mauvais résultats obtenus avec les réseaux de neurones sont généralement dus à l'absence d'une démarche de sélection de modèle, notamment en ce qui concerne l'architecture (nombre de couches cachées, nombre de neurones par couche).", permettez-moi de vous demander de bien vouloir m'indiquer une documentation traitant de méthodologie de choix de type ou d'architecture et de topologie de réseau approprié à un problème donné. Bien entendu, je ne parle pas des différentes définitions d'architectures possibles, entre autres existantes un peu partout, mais plutôt de vrais méthodologies pour bien définir son réseau en partant de la simple spécification du problème à résoudre.

    Vous remerciant d'avance

  6. #6
    Membre éclairé
    Inscrit en
    Janvier 2006
    Messages
    288
    Détails du profil
    Informations forums :
    Inscription : Janvier 2006
    Messages : 288
    Par défaut
    Bonjour,

    Mafanta, je ne sais pas trop si j'ai bien compris le sens de vôtre interrogation à laquelle je vais tenter d'apporter quelques éléments de réponse, espérant me rendre utile ne serait ce que peu.

    A mon sens, lorsqu'on dispose d'une série d'algorithmes proposés pour répondre à un problème donné le meilleur serait celui donnant la solution optimale ou celle se rapprochant de l'optimalité donc faisant le moins d'erreurs et ce, indépendamment de la nature des algorithmes en question et particulièrement indépendamment du fait que ce soient des réseaux de neurones artificels, des arbres de décision ou tout autre classifieur ou prédicteur.

    En gros, les réseaux de neurones, les SVM ou les arbres de décision peuvent avoir une bonne résonance mais ce n'est pas pour autant qu'ils seront meilleurs qu'un tout petit code avec une simple formule mathématique si celui-ci arrive à donner une solution optimale.

    Bien à Vous

  7. #7
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2007
    Messages
    200
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 200
    Par défaut
    Bonjour,

    Mafanta, je ne sais pas trop si j'ai bien compris le sens de vôtre interrogation à laquelle je vais tenter d'apporter quelques éléments de réponse, espérant me rendre utile ne serait ce que peu.

    A mon sens, lorsqu'on dispose d'une série d'algorithmes proposés pour répondre à un problème donné le meilleur serait celui donnant la solution optimale ou celle se rapprochant de l'optimalité donc faisant le moins d'erreurs et ce, indépendamment de la nature des algorithmes en question et particulièrement indépendamment du fait que ce soient des réseaux de neurones artificels, des arbres de décision ou tout autre classifieur ou prédicteur.

    En gros, les réseaux de neurones, les SVM ou les arbres de décision peuvent avoir une bonne résonance mais ce n'est pas pour autant qu'ils seront meilleurs qu'un tout petit code avec une simple formule mathématique si celui-ci arrive à donner une solution optimale.

    Bien à Vous
    Tout d'abords merci à tous pour vos réponses.
    Je comprends un peu mieux maintenant.
    en gros quand on a un probleme il faut faire tourner plusieurs algo sur ses données puis voir celui qui prédit le mieux suivant le taux d'erreur.
    En fait moi je croyais que quand on a un problème il y'a forcément un type d'algo qui doit être appliqué. Par exemple un probleme de prédiction comme le mien, je pensais qu'il fallait toujours choisir l'arbre de décision et ne jamais choisir les réseaux de neurones etc..

    merci.

  8. #8
    Membre Expert
    Homme Profil pro
    Chercheur
    Inscrit en
    Mars 2010
    Messages
    1 218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Mars 2010
    Messages : 1 218
    Par défaut
    Bonjour,

    Citation Envoyé par medchok Voir le message
    En gros, les réseaux de neurones, les SVM ou les arbres de décision peuvent avoir une bonne résonance mais ce n'est pas pour autant qu'ils seront meilleurs qu'un tout petit code avec une simple formule mathématique si celui-ci arrive à donner une solution optimale.
    Oui, c'est bien connu et il y a même une théorie là-dessus, les théorèmes "no free lunch". La véritable question est d'identifier les algorithmes donnant les meilleurs performances en moyenne. C'est comme au poker : on peut gagner avec 7 et 2 devant une paire d'as mais sur "le long terme" (comprendre "en moyenne"), il est tout de même préférable de partir avec une paire d'as!

  9. #9
    Membre Expert
    Homme Profil pro
    Chercheur
    Inscrit en
    Mars 2010
    Messages
    1 218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Mars 2010
    Messages : 1 218
    Par défaut
    Bonjour,


    Citation Envoyé par medchok Voir le message
    permettez-moi de vous demander de bien vouloir m'indiquer une documentation traitant de méthodologie de choix de type ou d'architecture et de topologie de réseau approprié à un problème donné.
    La méthodologie est simple et toujours la même. La base de données est divisée en 3 bases distinctes, l'une pour l'apprentissage, l'une pour le test et la dernière pour la validation. On boucle sur plusieurs valeurs des paramètres de l'algorithme d'apprentissage employé (nombre de couches cachées, nombre de neurones par couches, taux d'apprentissage, etc). Il y a bien sûr autant de boucles que de paramètres à optimiser. A chaque itération, on apprend un modèle avec l'algorithme étudié et la base d'apprentissage puis on évalue les performances de ce modèle sur la base de validation à l'aide d'un ou plusieurs critères (taux d'erreur, critère d'Akaike, critère BIC, etc). Une fois sorti des boucles, on sélectionne le meilleur modèle, i.e. le jeu de paramètres qui a donné les meilleurs performances selon le critère d'évaluation retenu. On peut ensuite appliqué ce modèle à la base de test pour estimer le biais et la variance par exemple.

  10. #10
    Nouveau candidat au Club
    Homme Profil pro
    Inscrit en
    Novembre 2011
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Savoie (Rhône Alpes)

    Informations professionnelles :
    Secteur : Conseil

    Informations forums :
    Inscription : Novembre 2011
    Messages : 3
    Par défaut Data Mining
    Bonjour à tous,

    Je me permets d'intervenir suite à la remarque d'un membre proposant les kmeans comme méthode de classification. Attention, les Kmeans font partie des méthodes de "clustering" et non de classification.

    la classification regroupe des méthodes d'apprentissage supervisé, i.e. la classe est connue à priori.
    le clustering regroupe les méthodes d'apprentissage non supervisé, i.e. la classe n'est pas connue à priori.

    Les deux approches conduisent à diviser une population en fonction de leurs attributs.

    Concernant le choix d'une approche, comme cela a été souligné, en premier il convient de prendre en considération la nature de tes attributs (continus, discrets, ...) afin de réduire le pré-processing des données. Ensuite, le choix d'un algorithme peut se faire par comparaison des résultats obtenus sur différents jeux de données.

  11. #11
    Membre confirmé
    Profil pro
    Inscrit en
    Août 2007
    Messages
    200
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2007
    Messages : 200
    Par défaut
    Merci KDACY pour ces informations tres utiles!!
    Encore merci.

Discussions similaires

  1. Classification en data mining
    Par DATA MINER dans le forum Méthodes prédictives
    Réponses: 0
    Dernier message: 23/04/2013, 01h25
  2. classification par réseau de neurones
    Par Marie_7 dans le forum MATLAB
    Réponses: 1
    Dernier message: 27/05/2012, 11h57
  3. Réseau de neurones : classification de n spectres de dimension d en k classes
    Par datydree dans le forum Méthodes prédictives
    Réponses: 18
    Dernier message: 11/10/2011, 23h29
  4. Réseau de neurones : classification de données
    Par a7med85 dans le forum Méthodes prédictives
    Réponses: 2
    Dernier message: 13/06/2010, 11h58
  5. Réseau de neurones pour la classification de signaux.
    Par jeanlouis_lecodeur dans le forum Méthodes prédictives
    Réponses: 3
    Dernier message: 26/03/2008, 18h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo