1 pièce(s) jointe(s)
Test d'indépendance di Khi-deux
Bonjour y_lebourhis,:cry:
voici comment vous devez procéder :
J'ai apporté une petite touche à votre base de données car c'étais nécessaire. L'usage du "read.csv" peut poser des problèmes d'interprétation selon le codage utilisé par votre système d'exploitation
csv = comma separated value. Mais comma = "," ou ";" ?
Pour éviter toute confusion, je préfère utilisé le read.table (en enregistrant au préalable le fichier au format txt avec le séparateur tabulation (\t) de préférence.
Ensuite, une fois les données bien chargées dans R, on ne se préoccupe que des deux variables qualitatives qui nous intéressent (age et utilordiclasse)
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
|
# on supose que la base de données se trouve dans le dossier de travail
bdd <- read.table("bdd.txt",header=TRUE) # recuperation de la base de données
str(bdd)# description de la base de donnees
tableau <- with(bdd, table(age,utilordiclasse)) # tableau de contingence
analyse <- chisq.test(tableau,correct=FALSE, simulate.p.value = FALSE)
# Attention:
# par défaut, R effectue un Khi-Deux avec correction de Yattes
#(correct=TRUE). Or, cette correction n'est utilisable que lorsque les deux
#variables sont binaires (les tableaux de 4 cases seulement). Il faudrait
#donc veiller à mettre ce paramètre à FALSE.
# la p-value peut être calculée par simulation monté-carlo (paramètre "simulate.p").
# Mettre ce paramètre à TRUE si l'on souhaite calculer la p-value
#par simulation monté carlo. Cette simulation est nécessaire si les effectifs
#théoriques sont faibles (moins de 5 individus dans certaines cases)
analyse # resultats du text
analyse$expected # tableaux des effectifs theoriques |
8-)