IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Test de normalité R


Sujet :

R

  1. #1
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    40
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Suède

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2018
    Messages : 40
    Par défaut Test de normalité R
    Bonjour,

    Je possède un échantillon de données de 35000 entités, je ne peux donc pas effectuer le test de Shapiro (car 35000>5000).
    Comment puis-je tester la normalité autrement ?

    Bonne journée

  2. #2
    Nouveau membre du Club Avatar de cdv04
    Femme Profil pro
    Ingénieure en biostatistique
    Inscrit en
    Juin 2017
    Messages
    8
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 48
    Localisation : France, Alpes de Haute Provence (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Ingénieure en biostatistique

    Informations forums :
    Inscription : Juin 2017
    Messages : 8
    Par défaut
    En échantillonnant aléatoirement 5000 données parmi les 35000 et en faisant le test de Shapiro sur ces 5000 ?

  3. #3
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2017
    Messages
    34
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2017
    Messages : 34
    Par défaut
    Pour ma part, plusieurs solutions possible:

    Faire des sample de 5000, stocker les valeurs et regarder le comportement des p-value.

    Autrement, faire un autre test de normalité: ks.test, lillie.test...


    Prog_R

  4. #4
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    40
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Suède

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2018
    Messages : 40
    Par défaut
    Comment puis-je rentrer les formules afin de tester qu'il s'agit bien d'une loi normale ?
    Car je ne peux pas séparer mes valeurs en plusieurs échantillons de 5000.

  5. #5
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2017
    Messages
    34
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2017
    Messages : 34
    Par défaut
    quelles formules ?
    Pourquoi tu ne peux pas séparer ta base ?

  6. #6
    Membre chevronné
    Inscrit en
    Février 2011
    Messages
    276
    Détails du profil
    Informations forums :
    Inscription : Février 2011
    Messages : 276
    Par défaut
    Bonjour,

    Jette un oeil à cette discussion :
    https://stats.stackexchange.com/ques...tially-useless

    cdlt

  7. #7
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    40
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Suède

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2018
    Messages : 40
    Par défaut
    prog_R, je ne peux pas séparer ma base car on m'a demandé de ne pas le faire. J'aimerais tester la normalité avec ks.test mais je ne sais pas comment rentrer la formule sous R.

  8. #8
    Nouveau membre du Club Avatar de cdv04
    Femme Profil pro
    Ingénieure en biostatistique
    Inscrit en
    Juin 2017
    Messages
    8
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 48
    Localisation : France, Alpes de Haute Provence (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Ingénieure en biostatistique

    Informations forums :
    Inscription : Juin 2017
    Messages : 8
    Par défaut
    Tu peux faire le test de Kolmogorov-Smirnov avec :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    ks.test(iris$Sepal.Length,"pnorm")
    Sinon, tu peux utiliser une méthode visuelle comme le qqplot :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    qqplot(mydf$my_variable)
    qqnorm(mydf$my_variable)
    J'espère que ça aide.

  9. #9
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    40
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Suède

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2018
    Messages : 40
    Par défaut
    Bonjour
    Je cherche a faire un tirage de 5000 échantillons d’une colonie de mon data traitement; seulement un message d’erreur s’affiche :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    error in 1:nrow(traitement$nbcourse) : l'argument est de longueur nulle
    voici la formule que j’utilise si quelqu’un peut m’aider :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    testloi=traitement$nbcourse[sample(1:nrow(traitement$nbcourse),5000),]
    merci

  10. #10
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2017
    Messages
    34
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2017
    Messages : 34
    Par défaut
    j'utilise généralement cette ligne de code:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    Sample_5000<-df[sample(1:nrow(df),5000,replace=FALSE),]
    Prog_R

  11. #11
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    40
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Suède

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2018
    Messages : 40
    Par défaut
    Merci de votre réponse mais j'ai tjrs le même problème, le même message d'erreur apparaît.

  12. #12
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2017
    Messages
    34
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2017
    Messages : 34
    Par défaut
    peux-tu me faire un copié/collé de la ligne de code stp
    je pense que tu as mis nrow(1:df$mavariable). je pense que le problème vient de là. Met simplement df.
    si tu veux mettre df$mavariable, remplace nrow par length(1:df$mavariable

    Prog_R

  13. #13
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    40
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Suède

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2018
    Messages : 40
    Par défaut
    traitement$nbcourse[sample(1:nrow(traitement$nbcourse),5000,replace=FALSE),]
    Erreur : objet 'course’ introuvable

    df correspond a mon fichier et $ à la colonne que je souhaite prendre

  14. #14
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Novembre 2017
    Messages
    34
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Finance

    Informations forums :
    Inscription : Novembre 2017
    Messages : 34
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    traitement = traitement[sample(1:length(traitement$nbcourse), 5000, replace=FALSE,]
    select(traitement, nbcourse)
    cela devrait fonctionner maintenant.
    Autrement, je vois pas

    Prog_R

  15. #15
    Membre averti
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2018
    Messages
    40
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Suède

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2018
    Messages : 40
    Par défaut
    Merci beaucoup, ca fonctionne !

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Test de normalité sur gros échantillons
    Par enicnath dans le forum SAS STAT
    Réponses: 2
    Dernier message: 02/12/2013, 10h04
  2. [XL-2007] test de normalité aderson darling en fonction
    Par miopie dans le forum Macros et VBA Excel
    Réponses: 0
    Dernier message: 11/01/2011, 12h08
  3. Test de Normalité
    Par bulledeneige dans le forum SAS STAT
    Réponses: 3
    Dernier message: 11/10/2010, 09h38
  4. Test de normalité dans la proc univariate
    Par enicnath dans le forum SAS STAT
    Réponses: 2
    Dernier message: 08/06/2009, 22h22
  5. Test de normalité
    Par ahmed85 dans le forum R
    Réponses: 2
    Dernier message: 17/04/2008, 22h31

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo