-
Probléme avec GMM-EM
Bonsoir tout le monde
bon j'ai un probléme avec l'algorithme GMM-EM, j'utilse ce dernier pour effectuer une classification des documents texte en langue Arabe, j'ai utilsé une API gratuite programmée en java dans laquelle j'ai trouvé le programme du GMM-EM que je le cherche depuis longtemps (j'ai essayé de le programmer moi même mais j'avais un probléme d'égalité de probabilité).
mon probléme est comme suit: pour un certain nombre de données ( je veux dire une dimension donné des vecteurs représentatifs des documents) le programme fonctionne bien , mais si je depasse un nombre de données le programme fonctionne mal est ne peux pas calculer les paramétres de l'algorithme (la moyenne et la matrice des covariances, il donne des NAN au lieu de donner des valeurs).
SVP je suis bloqué aide moi :cry:, je veux une explication mathématique à mon probléme et merci d'avance.
-
Bonsoir,
a priori c'est un problème numérique : le code que tu as pris n'est pas stable. Il y a de bonnes chances que cela vienne du fait que ta matrice de covariance est singulière ou très mal conditionnée. Or, tu dois l'inverser dans ta mixture de gaussiennes. En passant, pour les grands jeux de données, on approche généralement la matrice de covariance par une matrice diagonale (variances) en supposant l'indépendance des variables (covariances nulle).
-
Probléme avec GMM-EM
D'abord merci beaucouq Aleph69 pour votre réponse, ce qui j ai compris d'aprés de cette dérnière que les résultats que j ai obtenus sont normales à cause de la nullité des covariances?
-
Bonsoir,
non pas du tout. Les covariances sont nulles si et seulement si les variables sont indépendantes. Est-ce le cas?