Bonjour,
Je cherche à comparer des vecteurs dont chaque valeur correpond a un rendement hebdomadaire d'action. Je ne sais pas trop quelle type de distance choisir: Euclidienne,L1,L2?
Merci pour votre aide,
Arnaud
Version imprimable
Bonjour,
Je cherche à comparer des vecteurs dont chaque valeur correpond a un rendement hebdomadaire d'action. Je ne sais pas trop quelle type de distance choisir: Euclidienne,L1,L2?
Merci pour votre aide,
Arnaud
Bonjour,
sans plus de précisions, j'ai toujours tendance à utiliser la distance Euclidienne ou du moins son carré.
Mais dans ton cas, il faudrait savoir dans quel but précis tu souhaites mesurer la distance entre tes deux vecteurs ?
Selon les applications tu peux avoir à détecter juste l'écart moyen entre les vecteurs (distance Euclidienne) ou tu peux vouloir minimiser le plus grand écart (distance max).
Donc tout va dépendre du but final de ton application...
Quelle différence entre Euclidienne et L2 ?Citation:
Je ne sais pas trop quelle type de distance choisir: Euclidienne,L1,L2?
Je voudrais créer des groupes homogènes d'actions dont les rendements ont un comportement similaires. Une classification avec comme distance l'écart moyen (distance Euclidienne) entre les vecteurs est donc une bonne approche.
Le seul problème c'est le cas de deux action qui ont des rendements similaires, sauf une fois ou deux. Je me demandais donc si il existe une distance qui permet de limiter cet effet "d'outlier"?
Bonjour,
si tu veux limiter l'effet des Outliers, il ne faut absolument pas utiliser la distance max.
Pour ce que tu veux faire (créer des groupes homogènes dans leurs efficacité), je te conseille de faire de clustering avec des Kmeans, ça devrait très bien fonctionner.