Bonjour,
Je possède un échantillon de données de 35000 entités, je ne peux donc pas effectuer le test de Shapiro (car 35000>5000).
Comment puis-je tester la normalité autrement ?
Bonne journée
Bonjour,
Je possède un échantillon de données de 35000 entités, je ne peux donc pas effectuer le test de Shapiro (car 35000>5000).
Comment puis-je tester la normalité autrement ?
Bonne journée
En échantillonnant aléatoirement 5000 données parmi les 35000 et en faisant le test de Shapiro sur ces 5000 ?
Pour ma part, plusieurs solutions possible:
Faire des sample de 5000, stocker les valeurs et regarder le comportement des p-value.
Autrement, faire un autre test de normalité: ks.test, lillie.test...
Prog_R
Comment puis-je rentrer les formules afin de tester qu'il s'agit bien d'une loi normale ?
Car je ne peux pas séparer mes valeurs en plusieurs échantillons de 5000.
quelles formules ?
Pourquoi tu ne peux pas séparer ta base ?
Bonjour,
Jette un oeil à cette discussion :
https://stats.stackexchange.com/ques...tially-useless
cdlt
prog_R, je ne peux pas séparer ma base car on m'a demandé de ne pas le faire. J'aimerais tester la normalité avec ks.test mais je ne sais pas comment rentrer la formule sous R.
Tu peux faire le test de Kolmogorov-Smirnov avec :
Sinon, tu peux utiliser une méthode visuelle comme le qqplot :
Code : Sélectionner tout - Visualiser dans une fenêtre à part ks.test(iris$Sepal.Length,"pnorm")
J'espère que ça aide.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 qqplot(mydf$my_variable) qqnorm(mydf$my_variable)
Bonjour
Je cherche a faire un tirage de 5000 échantillons d’une colonie de mon data traitement; seulement un message d’erreur s’affiche :
voici la formule que j’utilise si quelqu’un peut m’aider :
Code : Sélectionner tout - Visualiser dans une fenêtre à part error in 1:nrow(traitement$nbcourse) : l'argument est de longueur nulle
merci
Code : Sélectionner tout - Visualiser dans une fenêtre à part testloi=traitement$nbcourse[sample(1:nrow(traitement$nbcourse),5000),]
j'utilise généralement cette ligne de code:
Prog_R
Code : Sélectionner tout - Visualiser dans une fenêtre à part Sample_5000<-df[sample(1:nrow(df),5000,replace=FALSE),]
Merci de votre réponse mais j'ai tjrs le même problème, le même message d'erreur apparaît.
peux-tu me faire un copié/collé de la ligne de code stp
je pense que tu as mis nrow(1:df$mavariable). je pense que le problème vient de là. Met simplement df.
si tu veux mettre df$mavariable, remplace nrow par length(1:df$mavariable
Prog_R
traitement$nbcourse[sample(1:nrow(traitement$nbcourse),5000,replace=FALSE),]
Erreur : objet 'course’ introuvable
df correspond a mon fichier et $ à la colonne que je souhaite prendre
cela devrait fonctionner maintenant.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 traitement = traitement[sample(1:length(traitement$nbcourse), 5000, replace=FALSE,] select(traitement, nbcourse)
Autrement, je vois pas
Prog_R
Partager