Bonjour,
J'étudie la distribution d'une variable aléatoire discrète (le nombre de taxons par échantillon). Je dispose de plusieurs sites dont les distributions varient. J'ai tenté de comparer les distributions empiriques avec des distributions théoriques, sur la base des fonctions de répartition. Dans certains cas, les données semblent suivre une loi de Poisson, dans d'autres une uniforme et dans d'autres encore une binomiale négative (je suis incertain quant au choix de ce type de distribution, puisqu'elle est binaire). J'aimerais effectuer un test d'ajustement adapté aux données, sachant que dans certains cas (sinon la majorité), la fréquence de certaines catégories ne dépassent pas 5 (impossible de procéder à un khi2). De même, le test exact de Fischer n'est pas approprié puisque ce ne sont pas des tables de contingences. Existe-t-il d'autres tests, comme Anderson-Darling ou Cramer von Mises, qui pourraient être appliqués aux variables discrètes ? Si non, j'ai cru comprendre que les simulations de Monte Carlo pouvaient être une autre piste mais je ne vois absolument pas comment l'appliquer.
J'utilise le logiciel R. Ci-dessous un exemple de script pour le test d'ajustement de CVM. Cela vous semble-t-il correct ?

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
library(goftest)
cvm.test(data$y, 'punif',min=min(data$y),max=max(data$y)) #data$y correspond au nombre de taxons par échantillon
Le x du script doit-il correspondre aux données ou à la fonction de répartition de ces données ?
Des graphes ont été systématiquement effectués pour comparer soit les fréquences empiriques et théoriques, soit les fonctions de répartition. Visuellement, les résultats sont intéressants mais j'aimerais avoir une p-value pour connaître le degré d'ajustement.
Je vous remercie sincèrement pour toute l'aide que vous pourrez m'apporter.