Bonjour,
Utilisateur pour le moins néophyte de SAS (avec des compétences pour le moins limitées en statistiques), j'ai un peu de problème pour comprendre la sémantique de la statistique de Cochran-Mantel-Haenszel.
J'ai deux échantillons indépendants, établis à deux dates différentes, et je voudrais voir s'il y a une différence significative entre les deux concernant des variables croisées.
Lorsque je fais des proc freq, pour les deux variables présentées ici, A et B croisées avec le sexe, j'obtiens des fréquences (proportion de filles ayant choisi l'option 1 de la variable A, puis de garçons, puis pour les options 2, 3 et 4), qui diffèrent entre les échantillons 1 et 2.
Ce qui me perturbe, c'est qu'il me semblait que le CMH2 permettait de voir si cette différence était significative entre les deux échantillons (donc les deux années). Or, à "vue de nez" les différences dans ces fréquences sont globalement les mêmes entre les années 1 et 2 pour les variables A et B.
Pourtant l'une a une p-value très faible, 0.0003, donc indiquerait une différence significative, et au contraire l'autre à une p-value énorme : 0.99.
Et à vue de nez donc, il n'y a pas grande différence dans les deux cas.
Du coup j'aimerais bien comprendre où est ce que le bât blesse niveau compréhension.
Voici le bout de code associé, si nécessaire :
Et le résultat :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 proc freq data=donnees; tables enquete*sexe*A enquete*sexe*B / cmh2;
Merci d'avance pour votre aide !
Partager