IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes exploratoires Discussion :

K means clustering


Sujet :

Méthodes exploratoires

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre habitué
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2011
    Messages : 10
    Par défaut K means clustering
    Bonjour,

    Je suis entrain d’implémenter l'algorithme K-means pour repartir une population de points en cluster cependant je rencontre quelques difficultés à la finaliser puisque j'obtiens aussi bien ça que ceci.
    Du coup je me demande si la précision de l'algo fait que je n'obtiens pas tout le temps le bon graph ou si c'est parce que j'ai fait une erreur dans mon code.
    Pour l'algorithme, je suis l’implémentation suivante:
    1 - Random des centroids
    2 - Affectation des points à chacun des centroids en utilisant la distance pour déterminer le centroid d'appartenance et calcul des nouveaux centroids
    3 - Check si les anciens centroids et les nouveaux centroids sont differents.
    4 - répétition de l'étape 2 et 3 jusqu’à ce que les anciens et nouveaux centroids soient les mêmes.

    Merci

  2. #2
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Par défaut
    Ton implémentation est bonne. Les résultats que tu obtiens sont typiques de l'algorithme K-Means.

    Comme indiqué dans le lien ci-dessus, tu peux grandement améliorer la segmentation en modifiant la méthode d'affectation des points :
    - pour chaque cluster calcul du centre ET de la variance => modélisation d'une distribution gaussienne G(x)
    - affectation d'un point selon sa probabilité d'appartenance aux gaussiennes => G1(x) > G2(x), alors x appartient au cluster 1
    ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.

  3. #3
    Membre habitué
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2011
    Messages : 10
    Par défaut
    Si j'ai bien compris, une fois que j'ai ma densité de probabilité pour chacun des clusters, j'utilise la règle de Bayle qui va me donner une probabilité d'appartenance à un cluster ??

  4. #4
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Par défaut
    Citation Envoyé par Edisean Voir le message
    Si j'ai bien compris, une fois que j'ai ma densité de probabilité pour chacun des clusters, j'utilise la règle de Bayle qui va me donner une probabilité d'appartenance à un cluster ??
    Si tu veux appliquer strictement la méthode "Expectation–maximization", oui c'est cela.

    Sinon, tu peux simplement utiliser la loi de proba (calculée a l'itération précédente) comme distance, en lieu et place de la distance euclidienne.
    ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.

  5. #5
    Membre habitué
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2011
    Messages : 10
    Par défaut
    Concernant Bayle, si je veux appliquer la règle à un point je dois bien faire:
    dP(x).dP(y) /ensemble(dP(x).dP(y)) avec dP= densité de probabilité lié à un cluster ??

    Merci pour tes réponses.

  6. #6
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Par défaut
    Citation Envoyé par Edisean Voir le message
    Concernant Bayle, si je veux appliquer la règle à un point je dois bien faire:
    dP(x).dP(y) /ensemble(dP(x).dP(y)) avec dP= densité de probabilité lié à un cluster ??

    Merci pour tes réponses.
    Je suppose que tu as séparé la loi de proba en un produit de 2 lois orthogonales, une sur X et une sur Y. Auquel cas, oui c'est bien cela.
    ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.

Discussions similaires

  1. Créer des clusters en utilisant k-means à partir d'un fichier XML
    Par mouned dans le forum Méthodes exploratoires
    Réponses: 1
    Dernier message: 13/02/2015, 16h52
  2. Color-Based Segmentation Using K-Means Clustering
    Par hg2051 dans le forum Images
    Réponses: 2
    Dernier message: 15/08/2011, 15h21
  3. segmentation d'images- fuzzy c-mean clustering
    Par nawraz dans le forum Images
    Réponses: 2
    Dernier message: 27/02/2008, 21h11
  4. Définition du clustering
    Par abdou.sahraoui dans le forum Administration
    Réponses: 5
    Dernier message: 04/05/2004, 09h31
  5. Cluster sous Débian 3.0 (Woody)
    Par regular dans le forum Développement
    Réponses: 3
    Dernier message: 06/08/2003, 11h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo