Bonjour,
je travaille actuellement sur un projet à la fac en fouille de données. L'objectif est de prédire la classe (positive ou négative) d'un certain nombre d'instances d'une base de validation, à partir d'instances d'une base d'apprentissage pour lesquelles la classe est connue.
J'ai choisi d'utiliser un algorithme de type proches voisins pour faire ma prédiction. Je calcule donc la distance entre l'instance à classer et les instances de ma base d'apprentissage et je procède par un vote à la majorité parmi les plus proches voisins pour choisir la classe de l'instance à classer.
Je crois comprendre qu'on appelle distance de Minkowski une distance telle que :
J'ai essayé de calculer mes distances avec différentes valeurs de p mais les résultats ne changent pas beaucoup en fonction de p. J'aimerais donc tester d'autres distances.
Ma question est donc la suivante : savez-vous s'il existe d'autres formules pour calculer la distance entre deux ensembles de valeurs ? (Les valeurs sont essentiellement des entiers)
Merci de m'avoir lu !
Partager