IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

Choisir le bon algorithme de clustering non supervisé


Sujet :

Méthodes prédictives

  1. #1
    Membre habitué Avatar de Onimaru
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2010
    Messages
    283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : Turquie

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Mars 2010
    Messages : 283
    Points : 129
    Points
    129
    Par défaut Choisir le bon algorithme de clustering non supervisé
    Salut à tous.

    J'ai un nombre important (des milliers) de données vectorielles. Je dois les partitionner en des sous-ensembles et manipuler les représentants de ces sous-ensembles. Sachant que je n'ai aucune connaissance à priori sur les classes des données.

    Je n'arrive pas à choisir un algorithme qui fait un bon compromis entre la rapidité et un partitionnement de bonne qualité, d'où ma question.

  2. #2
    Expert éminent sénior Avatar de Flodelarab
    Homme Profil pro
    Inscrit en
    Septembre 2005
    Messages
    5 243
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente (Poitou Charente)

    Informations forums :
    Inscription : Septembre 2005
    Messages : 5 243
    Points : 13 458
    Points
    13 458
    Par défaut
    Bonjour,

    d'où ma question.
    Je vois de la prose, des mots en gras, mais pas de question. Quelle est-elle ?

    Quelles sont les "manipulations" que tu évoques ?
    Cette réponse vous apporte quelque chose ? Cliquez sur en bas à droite du message.

  3. #3
    Membre habitué Avatar de Onimaru
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2010
    Messages
    283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : Turquie

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Mars 2010
    Messages : 283
    Points : 129
    Points
    129
    Par défaut
    J'ai dit que je n'arrive pas à choisir entre beaucoup d'algorithmes de clustering. Par exemple, j'ai lu que K-means est trop lent et dépend du K qu'on doit fixer au préalable. Il y a beaucoup algorithmes, je demande donc l'avis des gens pour me conseiller.

    PS : Les phrases en gras indiquent des informations que je juge importantes. Par "question" je parle de la discussion elle-même.

  4. #4
    Membre éclairé
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Janvier 2012
    Messages
    325
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Janvier 2012
    Messages : 325
    Points : 888
    Points
    888
    Par défaut
    Il n'y a pas vraiment de méthode de clustering "universelle", la façon dont on fait les groupes dépend de la structure des données (et de leur nombre) et de ce qu'on veut faire avec ces groupes.

  5. #5
    Futur Membre du Club
    Homme Profil pro
    autres
    Inscrit en
    Septembre 2012
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : autres
    Secteur : Santé

    Informations forums :
    Inscription : Septembre 2012
    Messages : 12
    Points : 8
    Points
    8
    Par défaut
    as tu essayé pvclust, c'est un package de R qui fait du clustering, il y a déjà plusieurs publications qui l'ont utilisé...

  6. #6
    Membre habitué Avatar de Onimaru
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2010
    Messages
    283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : Turquie

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Mars 2010
    Messages : 283
    Points : 129
    Points
    129
    Par défaut
    Merci. Je ne connais pas, je vais voir.

  7. #7
    Membre habitué Avatar de Onimaru
    Homme Profil pro
    Étudiant
    Inscrit en
    Mars 2010
    Messages
    283
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : Turquie

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Enseignement

    Informations forums :
    Inscription : Mars 2010
    Messages : 283
    Points : 129
    Points
    129
    Par défaut
    Salut à tous.

    Si on prend le K-Means, selon votre expérience, qu'elle est la méthode la plus rapide qui permet de trouver le bon nombre de clusters (K), du moins, d'une façon qui se rapproche de l'optimal ?

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. apprentissage non supervisé .......
    Par ratbert dans le forum Statistiques, Data Mining et Data Science
    Réponses: 7
    Dernier message: 22/02/2008, 12h23
  2. [AJAX] Choisir le bon toolkit
    Par ptr83 dans le forum Développement Web en Java
    Réponses: 2
    Dernier message: 25/10/2006, 11h42
  3. comment choisir le bon optimizer_mode
    Par Oraman dans le forum Oracle
    Réponses: 5
    Dernier message: 06/09/2006, 18h20
  4. Réponses: 3
    Dernier message: 18/08/2006, 09h40
  5. Réponses: 3
    Dernier message: 09/06/2006, 14h49

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo