Bonjour,
J’ai un certain nombre de variables, qui ont été centrées réduites et qui sont corrélées entre elles à des niveaux variés.
Je cherche à calculer un indicateur qui fasse en quelque sorte la synthèse de ces variables. En passant les détails superflus, on peut considérer que je fais simplement la somme de toutes ces variables.
Ce qui me pose problème c’est que ces variables sont choisies arbitrairement, et que certaines peuvent faire doublon (2 mesures différentes de la même chose par exemple). Ce que j’aimerais faire c’est attribuer un poids à chaque variable de telle façon que les variables fortement corrélées à d’autres variables soit pénalisées, tandis que les variables « originales » soient favorisées.
Par exemple, si on prend 3 variables, deux d’entre elles étant corrélées à 100% une 3ème étant corrélée à 0% avec les deux premières, j’aimerais mettre des poids du style 0.5 pour les deux premières et 1 pour la 3ème. (Bien sûr c’est juste un exemple, mes vraies variables ne sont pas corrélées à 0 ou 100%).
Est-ce que quelqu’un connaitrait quelque chose qui se rapproche de ça ?
Merci.
Partager