IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Dendrogramme sur R


Sujet :

R

  1. #1
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2013
    Messages
    1
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2013
    Messages : 1
    Points : 1
    Points
    1
    Par défaut Dendrogramme sur R
    Bonjour,

    Je suis étudiante et en stage. J’ai relativement peu pratiqué le logiciel R en cours (on nous faisait faire les stats à la main) et du coup je ne maitrise pas très bien, je me débrouille comme je peux.

    J’ai 32 nids et pour chaque nid, 11 valeurs de surfaces (surface en eau, en friches,…).Je dois réaliser un dendrogramme des sites de nidification (abs) en fonction des surfaces d’occupation du sol (ordonnées) pour pouvoir faire des groupes et voir quels nids se ressemblent.

    J’ai donc un fichier avec 32 colonnes pour chaque nid et 12 lignes.
    Comment réaliser ce dendrogramme ? Je suis vraiment perdue et nulle sur R. On m’a donné un script mais ça ne m’aide pas vraiment, c’est encore pire que sans !

    Merci de votre aide

    Madounette

  2. #2
    Nouveau membre du Club
    Inscrit en
    Mai 2013
    Messages
    18
    Détails du profil
    Informations forums :
    Inscription : Mai 2013
    Messages : 18
    Points : 38
    Points
    38
    Par défaut
    Bonjour,

    Si j'ai bien compris tu as envie de faire une classification. Rapidement sur la méthodologie, une classification comprend deux étapes :
    - la première est la définition de la distance : comment j'évalue la distance entre deux nids ?
    - la seconde est le critère d'agrégation : comment je fais mes groupes, on peut alors distinguer type de situations :
    - 1 : je connais a priori le nombre de groupes (méthode des K-means)
    - 2 : je ne connais pas le nombre de groupes (classification ascendante hierarchique CAH par exemple).

    D'après ce que j'ai compris tu veux faire des groupes de nids en fonctions de tes 11 valeurs de surfaces. Pour commencer : ton individu (au sens statistique) est un nid, tes 11 valeurs de surfaces sont 11 variables, ton tableau de données doit donc être transposé pour que une ligne correspondent à 1 nids décrit par tes 11 variables en colonnes.

    Maintenant tu as des individus et pas mal de variables, il faut calculer une distance. Pour ça tu as 11 variables quantitatives, une manière simple de calculer une distances dans ce cas est de réaliser une analyse factorielle, ici, probablement une ACP : c'est à dire que globalement, tu trouves le meilleur "angle" pour voir tes données, pour avoir un nuage de points le plus étalé possible. Plus techniquement, l'ACP va te permettre de trouver une suites de composantes (axes) orthogonales entre elles (non correllees) qui vont maximiser l'inertie / variabilité du nuage de points. Bref, avec une ACP tu obtiens un plan, et c'est en considérant ce plan que tu as la distance entre individus.

    Maintenant que tu as une distance, si tu ne connais pas le nombre de groupes que tu veux obtenir (c'est ce que je crois comprendre) tu peux choisir une CAH qui va te construire des groupes basés sur la distance et te proposeras un nombre de groupes optimale qui sera le meilleur compromis entre variabilité à l'intérieur d'un groupe (mes individus dans mon groupe sont homogènes entre eux) et la variabilité entre deux groupes (mon groupe A est bien distinct de mon groupe B).

    Ça c'est le fond de la méthodologie qu'il est bon de comprendre quand tu fais une classification. Concrètement, si tu débute avec R, je t'encourage à utiliser le paquet FactoMineR, mis au points entre autre par F. Husson, J. Josse, S. Lê, J. Pagès, au laboratoire de Mathématiques Appliquées de Agrocampus Ouest (Rennes). Il dispose d'une interface graphique ajoutée à Rcmdr si tu l'installes en te référant à cette page :

    http://factominer.free.fr/interface/index_fr.html

    Sur ce même site un exemple d'ACP avec son script est proposé :
    http://factominer.free.fr/classical-...incipales.html

    Et même un exemple de CAH (HCPC) :
    http://factominer.free.fr/classical-...incipales.html

    Globalement tu devrais travailler avec un script du genre :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
     
    library(FactoMineR)
    # ACP :
    res.pca <-  PCA(tesDonnees)
     
    # CAH :
    res.cah <- HCPC(res.pca)
    Bon courage.

Discussions similaires

  1. Réponses: 10
    Dernier message: 20/09/2012, 16h45
  2. Documentation gratuite sur l'API Windows, COM, DCOM, OLE, etc.
    Par Community Management dans le forum Windows
    Réponses: 1
    Dernier message: 16/11/2006, 15h28
  3. [Kylix] Kylix embarqué sur PDA ?
    Par Anonymous dans le forum NoSQL
    Réponses: 10
    Dernier message: 29/11/2002, 13h59
  4. Réponses: 4
    Dernier message: 27/03/2002, 11h03
  5. F.A.Q, Doc, cours, tutoriels sur JBuilder
    Par Ricky81 dans le forum JBuilder
    Réponses: 0
    Dernier message: 14/03/2002, 15h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo