IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Debutant bloqué pour calcul manuel de correlation (TP débutant)


Sujet :

R

  1. #1
    Membre à l'essai
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2014
    Messages
    24
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2014
    Messages : 24
    Points : 12
    Points
    12
    Par défaut Debutant bloqué pour calcul manuel de correlation (TP débutant)
    Bonjour à tous, je débute en R et lors d'un TP visant à nous faire comprendre quelles formules entrent en compte lors des utilisations des commandes (exemple : cov(), mean(), cor()) afin que nous voyons les differences induites par R par rapport aux formules de base.

    Nous devons donc comparer les version "formulée" et les version "commandes R" (je parles des résultats) afin d'étudier les variations tout se passe bien jusqu'a la dernière question, celle de cor()...

    Mon problème est le suivant :

    j'utilise cars, voici mes étapes :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    data(cars)
    attach(car)
    x <- speed    /* je met la colonne de la vitesse dans x, et celle de la distance de freinage correspondante dans y */
    y <- dist
    lorsque j’essaye de rentrer manuellement la formule de la corrélation suivante :

    Nom : cor.png
Affichages : 137
Taille : 3,9 Ko

    (que l'on me demande de mettre une variable r) je tape la ligne suivante
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    r = (sum(length(x)-mean(x))*sum(length(y)*mean(y)))/sqrt(sum(length(x)-(mean(x))^2))*sqrt(sum(length(y)-(mean(y))^2))
    je ne sais pas si mes parenthèses sont male mises (j'ai essayé plus d'une heure, plusieurs combinaisons) mais il en retourne toujours l'output suivant :
    Nom : erreur cor.PNG
Affichages : 130
Taille : 3,8 Ko

    si vous savez ou j'me plante, je suis preneur, je commence a me démotivé (d'autant plus je sais tres bien qu'on a inventé cor() pour cette raison justement) !

    Bien cordialement,

    Pierre

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Première astuce : découper votre code pour tester pas à pas plutôt que d'exécuter directement une grosse ligne de code comme ça

    Quelques pistes :

    • Y a-t-il des NA (valeurs manquantes) dans vos données x et y ?
    • Le résultat de la soustraction passée dans la racine carrée ("sqrt") est-il / peut-il être négatif ? Si oui, cela va coincer...


    HTH !


    Cordialement,


    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  3. #3
    Membre éclairé
    Homme Profil pro
    Chercheur
    Inscrit en
    Décembre 2015
    Messages
    327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 327
    Points : 793
    Points
    793
    Par défaut
    Es-tu vraiment sûr que ton code correspond à la formule ? Début de réponse : que vient faire la fonction length dans le code ?

  4. #4
    Membre averti
    Homme Profil pro
    Data scientist
    Inscrit en
    Février 2017
    Messages
    211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data scientist
    Secteur : Conseil

    Informations forums :
    Inscription : Février 2017
    Messages : 211
    Points : 343
    Points
    343
    Par défaut
    Bonjour,

    Il y a des erreurs dans la formule, le length je ne comprends pas , est ce que sum(x*y) = sum(x)*sum(y) ?

    je te laisse réfléchir un peu si t'arrives pas, tu peux demander la formule.

    Bon courage.


  5. #5
    Membre éclairé
    Homme Profil pro
    Chercheur
    Inscrit en
    Décembre 2015
    Messages
    327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 327
    Points : 793
    Points
    793
    Par défaut
    1) Il y a tellement d'erreurs basiques dans le code de Aztharos que je lui conseillerais d'abord de relire son code et, éventuellement, d’approfondir en général les règles de la programmation avant de lui donner la solution.

    2) Pour réagir à l'objectif de l'exercice "Bonjour à tous, je débute en R et lors d'un TP visant à nous faire comprendre quelles formules entrent en compte lors des utilisations des commandes (exemple : cov(), mean(), cor()) afin que nous voyons les differences induites par R par rapport aux formules de base", je suis en désaccord avec l'intitulé. R n'induit pas des différences par rapport aux formules de base, R est un outil statistique donc propose les formulations de base pour l'estimation statistique de ces valeurs à partir d'un échantillon de taille finie, pour une population supposée infinie (ou de très nombreux ordres de grandeurs en taille par rapport à celle de l'échantillon) et non les formulations de base pour une population finie en incluant alors tous les individus de la population. J'espère donc que Aztharos a simplifié l'intitulé car autrement, je le considère quant à moi, comme erroné.

Discussions similaires

  1. [AC-2003] Bloqué pour calculer la somme d'un champ entre 2 date
    Par bastien3117 dans le forum Requêtes et SQL.
    Réponses: 3
    Dernier message: 24/08/2009, 13h08
  2. Local Phase Correlation pour calcul disparité
    Par ecstasy2 dans le forum Images
    Réponses: 0
    Dernier message: 13/01/2009, 18h52
  3. [Débutant] Petit problème pour calcul de somme
    Par kriskikout dans le forum Ada
    Réponses: 4
    Dernier message: 04/11/2006, 06h47
  4. [DEBUTANT] Probelme pour calculer 2 champs dans un etat
    Par The_freeman dans le forum Access
    Réponses: 1
    Dernier message: 18/06/2006, 18h12
  5. Réponses: 2
    Dernier message: 01/04/2003, 22h09

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo