IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes exploratoires Discussion :

K means clustering


Sujet :

Méthodes exploratoires

  1. #1
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2011
    Messages : 10
    Points : 6
    Points
    6
    Par défaut K means clustering
    Bonjour,

    Je suis entrain d’implémenter l'algorithme K-means pour repartir une population de points en cluster cependant je rencontre quelques difficultés à la finaliser puisque j'obtiens aussi bien ça que ceci.
    Du coup je me demande si la précision de l'algo fait que je n'obtiens pas tout le temps le bon graph ou si c'est parce que j'ai fait une erreur dans mon code.
    Pour l'algorithme, je suis l’implémentation suivante:
    1 - Random des centroids
    2 - Affectation des points à chacun des centroids en utilisant la distance pour déterminer le centroid d'appartenance et calcul des nouveaux centroids
    3 - Check si les anciens centroids et les nouveaux centroids sont differents.
    4 - répétition de l'étape 2 et 3 jusqu’à ce que les anciens et nouveaux centroids soient les mêmes.

    Merci

  2. #2
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 081
    Points
    16 081
    Par défaut
    Ton implémentation est bonne. Les résultats que tu obtiens sont typiques de l'algorithme K-Means.

    Comme indiqué dans le lien ci-dessus, tu peux grandement améliorer la segmentation en modifiant la méthode d'affectation des points :
    - pour chaque cluster calcul du centre ET de la variance => modélisation d'une distribution gaussienne G(x)
    - affectation d'un point selon sa probabilité d'appartenance aux gaussiennes => G1(x) > G2(x), alors x appartient au cluster 1
    ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.

  3. #3
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2011
    Messages : 10
    Points : 6
    Points
    6
    Par défaut
    Si j'ai bien compris, une fois que j'ai ma densité de probabilité pour chacun des clusters, j'utilise la règle de Bayle qui va me donner une probabilité d'appartenance à un cluster ??

  4. #4
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 081
    Points
    16 081
    Par défaut
    Citation Envoyé par Edisean Voir le message
    Si j'ai bien compris, une fois que j'ai ma densité de probabilité pour chacun des clusters, j'utilise la règle de Bayle qui va me donner une probabilité d'appartenance à un cluster ??
    Si tu veux appliquer strictement la méthode "Expectation–maximization", oui c'est cela.

    Sinon, tu peux simplement utiliser la loi de proba (calculée a l'itération précédente) comme distance, en lieu et place de la distance euclidienne.
    ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.

  5. #5
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2011
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2011
    Messages : 10
    Points : 6
    Points
    6
    Par défaut
    Concernant Bayle, si je veux appliquer la règle à un point je dois bien faire:
    dP(x).dP(y) /ensemble(dP(x).dP(y)) avec dP= densité de probabilité lié à un cluster ??

    Merci pour tes réponses.

  6. #6
    Rédacteur
    Avatar de pseudocode
    Homme Profil pro
    Architecte système
    Inscrit en
    Décembre 2006
    Messages
    10 062
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 51
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Architecte système
    Secteur : Industrie

    Informations forums :
    Inscription : Décembre 2006
    Messages : 10 062
    Points : 16 081
    Points
    16 081
    Par défaut
    Citation Envoyé par Edisean Voir le message
    Concernant Bayle, si je veux appliquer la règle à un point je dois bien faire:
    dP(x).dP(y) /ensemble(dP(x).dP(y)) avec dP= densité de probabilité lié à un cluster ??

    Merci pour tes réponses.
    Je suppose que tu as séparé la loi de proba en un produit de 2 lois orthogonales, une sur X et une sur Y. Auquel cas, oui c'est bien cela.
    ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.

  7. #7
    Membre expérimenté
    Homme Profil pro
    Chercheur
    Inscrit en
    Mars 2010
    Messages
    1 218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Mars 2010
    Messages : 1 218
    Points : 1 685
    Points
    1 685
    Par défaut
    Bonjour,

    tu peux également exploiter la disjonction des clusters pour exprimer ta densité de probabilité comme un mélange de lois et utiliser la propriété de Markov pour en simplifier l'expression. Il existe une interprétation probabiliste des k-moyennes qui est par exemple décrite dans le livre de Dreyfus et al. anciennement intitulé "Réseaux de neurones", qui s'appelle "Apprentissage statistique" dans sa dernière version, et qui est publié chez Eyrolles.

Discussions similaires

  1. Créer des clusters en utilisant k-means à partir d'un fichier XML
    Par mouned dans le forum Méthodes exploratoires
    Réponses: 1
    Dernier message: 13/02/2015, 16h52
  2. Color-Based Segmentation Using K-Means Clustering
    Par hg2051 dans le forum Images
    Réponses: 2
    Dernier message: 15/08/2011, 15h21
  3. segmentation d'images- fuzzy c-mean clustering
    Par nawraz dans le forum Images
    Réponses: 2
    Dernier message: 27/02/2008, 21h11
  4. Définition du clustering
    Par abdou.sahraoui dans le forum Administration
    Réponses: 5
    Dernier message: 04/05/2004, 09h31
  5. Cluster sous Débian 3.0 (Woody)
    Par regular dans le forum Développement
    Réponses: 3
    Dernier message: 06/08/2003, 11h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo