IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Choix des méthodes de calcul de matrices de distance (Dist)


Sujet :

R

  1. #1
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mars 2012
    Messages
    27
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2012
    Messages : 27
    Points : 5
    Points
    5
    Par défaut Choix des méthodes de calcul de matrices de distance (Dist)
    Bonjour,

    j'ai besoin de connaitre sur quoi devrais-je me baser pour choisir telle ou telle méthode pour calculer ma matrice de distance?

    Pour l'instant j'ai essayé la méthode par défaut (euclidienne) et aussi Canbera qui m'a donné un bon résultat.

    Mais je veux savoir de quoi dépend le choix.

    Est-ce que le nombre de lignes/colonnes dans un jeu de données est le facteur pincipal?

    Cordialement.

  2. #2
    Membre habitué
    Homme Profil pro
    Analyste
    Inscrit en
    Février 2012
    Messages
    62
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Analyste

    Informations forums :
    Inscription : Février 2012
    Messages : 62
    Points : 143
    Points
    143
    Par défaut
    Bonjour,

    Le choix de la distance que vous devez choisir ne dépend pas de la taille de vos données. Ce qu'il faut savoir c'est que chacune des distances correspond à une façon plutôt qu'une autre de considérer que deux points sont proches.

    S'il existe différentes méthodes c'est parce qu'il existe différentes distances qui ne vous donneront pas les même résultats (vous avez pu vous en rendre compte puisqu' apparemment Canberra vous donne de "bons" résultats comparée à la distance euclidienne.)

    Par exemple la distance euclidienne revient à dire "Le plus court chemin pour aller d'un point A à un point B est la ligne droite." (nous réfléchissons souvent en distance euclidienne). La distance de Manhattan, du nom du célèbre arrondissement de New York, revient elle à dire que lorsque l'on ne peut pas aller tout droit, prendre d'abord à gauche puis à droite, ou d'abord à droite puis à gauche revient au même.

    Et il en existe bien d'autres !

    Je suppose que vous réalisez un clustering à partir de vos matrices de distances, sachez donc que votre choix de méthode détermine la façon dont vous agrégez vos individus et, partant de là, vos résultats.

    J'espère avoir pu vous aider un peu...

    À bientôt,

    PS :
    Dans la plupart des cas vous utiliserez la distance euclidienne.
    Petit complément d'informations : http://http://fr.wikipedia.org/wiki/...%A9matiques%29

  3. #3
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mars 2012
    Messages
    27
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mars 2012
    Messages : 27
    Points : 5
    Points
    5
    Par défaut
    Bonjour et Merci pour votre réponse.

    j'ai fait des recherches sur les méthodes de distances sous R mais je n'ai pas trouvé beaucoup de documentation qui illustre bien ceci. Si vous en disposez, merci bien de me les fournir.

    Pour l'instant, la méthode euclidienne et Manathan c'est clair, mais le reste pas encore, surtout Canbera

    Cordialement
    encore merci

Discussions similaires

  1. Calculs des vecteurs propres d'une matrice Symétrique
    Par nadal1991 dans le forum Mathématiques
    Réponses: 20
    Dernier message: 22/06/2011, 00h04
  2. Réponses: 11
    Dernier message: 07/03/2010, 21h09
  3. Choix des matrices pour un terrain en 2D ?
    Par Pablodetaix dans le forum OpenGL
    Réponses: 2
    Dernier message: 27/10/2009, 16h41
  4. Calcul rapide des valeurs propres d'une matrice creuse
    Par gsagnol dans le forum Mathématiques
    Réponses: 3
    Dernier message: 21/12/2007, 23h37
  5. Calculer une matrice avec la méthode de EULER
    Par lematlabeur dans le forum MATLAB
    Réponses: 7
    Dernier message: 05/11/2007, 18h22

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo