IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Classification HCPC et distance


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2018
    Messages
    23
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2018
    Messages : 23
    Par défaut Classification HCPC et distance
    Bonjour,

    J'ai une question qui peut être simple mais je n'ai pas une réponse: j'ai appliqué une classification sur un jeu de données en utilisant la fonction HCPC. J'ai eu 4 classes, ma question est comment déterminer un nombre k données des individus les plus éloignés de centre de classe (dans la même classe) ? Merci à vous.
    Bonne journée.

  2. #2
    Membre éprouvé
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Décembre 2015
    Messages
    72
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Décembre 2015
    Messages : 72
    Par défaut
    Bonjour,

    A ma connaissance, il n'est pas possible d'avoir les k éléments les plus éloignés des centres de classe (à l'inverse des parangons qui sont donnés).

    Du coup, Il me semble qu'il faut récupérer les classes de chaque individu (à partir des résultats de HCPC), reprendre leurs coordonnées factorielles (à partir de l'ACP/ACM:etc...) et recalculer les centres de classes et les distances à ces classes (Si j'ai bon souvenir, il faut pondérer ses distances par les valeurs propres associées à chacun des nouveaux axes factoriels).

    On peut alors extraire les k éléments les plus distants. Je pense que cela demande un peu de calcul et un peu de temps à écrire mais la méthode reste simple.

    Cordialement

    VV

  3. #3
    Membre expérimenté
    Profil pro
    Loisir
    Inscrit en
    Novembre 2011
    Messages
    159
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Loisir

    Informations forums :
    Inscription : Novembre 2011
    Messages : 159
    Par défaut
    Le paquet FactomineR pourrait répondre partiellement à cette question mais affiche seulement les 5 individus les plus proches ou les plus éloignés. Regarde aussi du côté des ade4 et de dudi.dist.

  4. #4
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2018
    Messages
    23
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2018
    Messages : 23
    Par défaut
    Bonjour,

    Malheureusement, avec l'option $desc.ind on peut voir que les 5 parangons les point les individus les plus proches du centre de classe ou les individus les plus éloignés des centres des autres classes.
    Ce que je veux c'est les k points les plus éloignés dans la même classe.

  5. #5
    Membre chevronné
    Inscrit en
    Février 2011
    Messages
    276
    Détails du profil
    Informations forums :
    Inscription : Février 2011
    Messages : 276
    Par défaut
    Citation Envoyé par FMarwen Voir le message
    Bonjour,

    Malheureusement, avec l'option $desc.ind on peut voir que les 5 parangons les point les individus les plus proches du centre de classe ou les individus les plus éloignés des centres des autres classes.
    Ce que je veux c'est les k points les plus éloignés dans la même classe.
    Bonjour,
    il te suffit de spécifier un nb.par plus grand que ton nombre d'individus dans la commande HCPC. Comme ça dans hc$desc.ind$para tu auras toutes les distances et tu n'as plus qu'a sélectionner les k plus grandes.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    k <- 10
    lapply(hc$desc.ind$para, function(x) sort(x, decreasing = TRUE)[1:k])
    Cdlt

  6. #6
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Octobre 2018
    Messages
    23
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2018
    Messages : 23
    Par défaut
    Merci à vous.

+ Répondre à la discussion
Cette discussion est résolue.

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo