Expectation - Maximization

**Qt forever** · 24/05/2011, 03h32

salut tout le monde

j'ai une base de donnée X dont x(j)un simple élément ( j = 1...N) par exemple le cas de N points dans un repère de deux dimension et que les éléments sont répartis en "k" groupe ( gaussien )

alors il faut estimer la probabilité du mélange gaussien par la méthode " Espérance- maximisation"

donc j'ai un probleme de concevoir cette méthode dans l'etape "E" , bon je suis ce qui est dit dans la page 2 de cet extrait :

http://www-rech.telecom-lille1.eu/co...64-lachkar.pdf

j'ai compris les formules mais quand j'ai voulu l'implémenter je ne comprenais pas certains choses, par exemple dans l'initialisation :

1/ comment déterminer le nombre des gaussiens au depart (k), et le centre de chaque gaussion ! est-ce que je l'initialise à (0,0) !

2/ quand j'ai fait la premiere itération j'ai trouvé que je ne peux pas calculer la valeur de la formule(3)
cad le poids de chaque gaussien alors comment je peut itérer si la premiere itération ne me renvois pas une valeur ( car il ya toujours l'inconnu "alpha" ) !!

pouvez vous mexpliquer svp ça fait 3 jours que j'essaye de la comprendre sans succès

**pseudocode** · 24/05/2011, 12h30

Envoyé par Qt forever

1/ comment déterminer le nombre des gaussiens au depart (k), et le centre de chaque gaussion ! est-ce que je l'initialise à (0,0) !

L'algo EM ne permet pas de déterminer le nombre (ni le type) de modèles qu'il y a dans le mélange. Il faut donc déterminer la valeur de "k" d'une autre façon (cf. "Cluster analysis")

2/ quand j'ai fait la premiere itération j'ai trouvé que je ne peux pas calculer la valeur de la formule(3)
cad le poids de chaque gaussien alors comment je peut itérer si la premiere itération ne me renvois pas une valeur ( car il ya toujours l'inconnu "alpha" ) !!

C'est à toi de fournir les paramètres initiaux (poids + paramètres).

On peut bien sur initialiser au hasard, mais les chances pour que l'algo converge sont assez mince (on peut faire plusieurs essais d'initialisation et garder le meilleur résultat).

Le plus commun c'est d'utiliser les résultats de la "Cluster analysis" pour déterminer les paramètres. Dans le cas des gaussiennes, le plus important est d'estimer précisément le centre µ. C'est généralement suffisant pour que l'algo EM converge.

**Qt forever** · 24/05/2011, 15h13

merci bcp de votre réponse

donc :

"" Il faut donc déterminer la valeur de "k" d'une autre façon (cf. "Cluster analysis")"""
il cite dans l'extrait qu'il utilise k-means , mais si je jette un coup d'oeil sur ma basse pour voir que mes données sont repartis en (par exemple) deux clusters , peux-je dépasser cette étape et donner directement ce nombre comme initialisation !
maintenant comment je pourrai initialiser les centres de ces deux clusters !

"""C'est à toi de fournir les paramètres initiaux (poids + paramètres)."""
voilà ce qui ma fait un conflit, dans l'extrait , il a indiqué qu'on initialise que les (paramatres = matrice de cov & µ ) donc il fallait aussi dire qu'on donne une valeur initiale a alpha ( le poids ) de chaque gaussien ! si c'est cela ! selon quoi ! au hasard ! comme :
alpha(1) = 0.6
alpha(2) = 0.4

j'ai compris de votre message que si je fais une erreur au depart dans l'initialisation des centres µ(i), ça risque que mon algo ne converge plus !

**pseudocode** · 24/05/2011, 15h36

Envoyé par Qt forever

peux-je dépasser cette étape et donner directement ce nombre comme initialisation !
maintenant comment je pourrai initialiser les centres de ces deux clusters !

Oui, tu peux directement utiliser une valeur empirique (k=2) pour le nombre de modèles ainsi que leur centre (µ).

Si tu ne précise que leur nombre, il faudra estimer au mieux la valeur de leur centre. Le k-means est un bon moyen pour cela.

donc il fallait aussi dire qu'on donne une valeur initiale a alpha ( le poids ) de chaque gaussien ! si c'est cela ! selon quoi ! au hasard ! comme :
alpha(1) = 0.6
alpha(2) = 0.4

Oui. Le plus simple c'est de mettre des poids uniformes (alpha1 = alpha2 = 0.5) et laisser l'algo converger.

j'ai compris de votre message que si je fais une erreur au depart dans l'initialisation des centres µ(i), ça risque que mon algo ne converge plus !

Avec les gaussiennes, il faut que les centres initiaux soient assez proche des centre réels, sinon ca ne converge pas bien.

**Qt forever** · 25/05/2011, 01h30

en passant par le lien de wikipedia dans " la section 3 " j'ai vu :

pour qu'on calcule la log-vraisemblance on fait :
"" la sommation du log d'une sommation "" alors que dans l'extrait que je me base il est ecrit
""la log du produit d'une sommation"" !
la quelle j'utilise ! c'est une erreur ou des versions de calculs !

**pseudocode** · 25/05/2011, 13h34

Envoyé par Qt forever

en passant par le lien de wikipedia dans " la section 3 " j'ai vu :

pour qu'on calcule la log-vraisemblance on fait :
"" la sommation du log d'une sommation "" alors que dans l'extrait que je me base il est ecrit
""la log du produit d'une sommation"" !
la quelle j'utilise ! c'est une erreur ou des versions de calculs !

Les deux sont exactes, car c'est une propriété de la fonction Log :

Log(a*b*c*...*z) = Log(a) + Log(b) + Log(c) + ... + Log(z)

Donc le Log d'un produit est égal a la sommation du Log

**atef086** · 29/05/2011, 02h20

Salut

, si vous pouvez me dire avec quoi on initialise les matrices de covariances et de moyennes

, et qu'elle est la taille de chaque matrice ?

**Qt forever** · 30/05/2011, 21h23

@pseudocode:
Quand on fréquente pas les math , l'oubli sera le resultat obtenu

Envoyé par atef086

si vous pouvez me dire avec quoi on initialise les matrices de covariances et de moyennes

, et qu'elle est la taille de chaque matrice ?

1/ matrice de covariance := matrice d'identité ( diagonal = 1 )
2/les k Vecteur moyen := centre de différents gaussiens que vous avez estimé avec k-means
3/ pour les poids de chaque gaussien :

Envoyé par pseudocode

Le plus simple c'est de mettre des poids uniformes (alpha1 = alpha2 = 0.5) et laisser l'algo converger.
Remarque :
Avec les gaussiennes, il faut que les centres initiaux soient assez proche des centre réels, sinon ca ne converge pas bien.

4/ pour la taille ( j'ai pas encore implémenté cette partie ) mais je pense que K*K
où k le nombre de clusters (gaussiens ) ( en attendant la confirmation

)

**atef086** · 31/05/2011, 19h27

Envoyé par Qt forever

2/les k Vecteur moyen := centre de différents gaussiens que vous avez estimé avec k-means

k vecteurs ? ça veut dire que si k == 3 alors j'ai 3 vecteurs ?? et la taille de chaque vecteur est d ?

Envoyé par Qt forever

4/ pour la taille ( j'ai pas encore implémenté cette partie ) mais je pense que K*K
où k le nombre de clusters (gaussiens ) ( en attendant la confirmation

)

pour moi je pense que c'est d*d (avec d == la dimension de données utilisées)

Et encore une petite demande, dans l'article de LACHKAR et al.
j'ai pu implémenter l'équation 4, mais apparemment j'ai fait une erreur dans l'implémentation de l'équation 5 et 6, la moyenne et un vecteur et la covariance et une matrice alors comment met à jour ces deux variables ?
et comment faire le calcule de (xj - ùi) , et sa transposée.

**Qt forever** · 02/06/2011, 01h46

""" k vecteurs ? ça veut dire que si k == 3 alors j'ai 3 vecteurs ?? et la taille de chaque vecteur est d ?"""

oui c'est ça .

"""pour moi je pense que c'est d*d (avec d == la dimension de données utilisées) """

je m'excuse vous avez raison cad si vos données sont sous un plan ( 2 dimensions ) alors la taille de matrice de covariance sera 2X2

**atef086** · 02/06/2011, 19h24

Envoyé par Qt forever

je m'excuse vous avez raison cad si vos données sont sous un plan ( 2 dimensions ) alors la taille de matrice de covariance sera 2X2

Non ce n'est pas le cas, pas 2*2, si tu utilise une image couleur RVB alors d = 3, sinon si tu utilise une image en niveau de gris alors d = 1.

**Qt forever** · 02/06/2011, 22h49

""" si tu utilise une image couleur RVB alors d = 3, sinon si tu utilise une image en niveau de gris alors d = 1."""

je ne sais pas pour les images , je parlais des données simples

Expectation - Maximization

Algorithmes et structures de données

Discussions similaires

Partager

Partager