Bonjour,
J'aimerais savoir s'il existe des travaux scientifiques (Articles, livres, etc) qui démontrent l'influence ou l'importance du nombre d'observations (nombre d'échantillons) pour une analyse de régression.
Merci
Version imprimable
Bonjour,
J'aimerais savoir s'il existe des travaux scientifiques (Articles, livres, etc) qui démontrent l'influence ou l'importance du nombre d'observations (nombre d'échantillons) pour une analyse de régression.
Merci
Bonjour,
la loi de shannon sur un échantillonnage donne une reconstruction du signal avec la moitié des maximum . Partant de ce principe , on a une idée que la moitié des observations suffisent pour l'étude de la déviation . Suffit de regarder une gaussienne
En fait j'aimerais réaliser une regression multiparamétrique et déterminer un R2. Une analyse précédente à été réalisée avec un jeux de 30 données (observations). J'aimerais démontrer qu'en augmentant les données (150 données) le modèle obtenu a plus de poids et de sens.
Le modèle a plus de poids avec 150 données qu'avec 30. C'est évident.
Et avec 1000, il en a encore plus.
Si on veut par exemple estimer l'êge moyen d'un groupe de 10000 personnes, plus on sonde un nombre élevé de personnes, plus on aura une estimation précise de cet âge moyen. Si tu prends un cours de statistiques, tu auras les formules toutes faites.
La question, c'est de voir si une estimation avec un risque d'erreur de 1 mois, ou une estimation avec un risque d'erreur de 3 mois c'est fondamentalement différent.
Si je me souviens bien de mes cours, en gros, en multipliant le nombre de personnes sondées par k, on divise l'intervalle de confiance par k.
Du coup, j'imagine un peu ton contexte .... tu dis qu'avec plus de données, tu auras des résultats plus précis. Mais ton interlocuteur, il sait que pour avoir plus de données, ça va coûter plus d'argent.
Et s'il a besoin d'une estimation, pas forcément très précise, il n'a pas envie de dépenser des fortunes, pour collecter des tas d'informations, pour améliorer la précision un tout petit peu.
Justement il faut utiliser l'intervalle de confiance pour encadrer les résultats et confirmer le nombre d'observation. Sachant que qu'une loi binomiale peut être avoir une approximation par une gaussie´ne . Pour k succès parmi n observations avec une probabilité de succès k
http://mistis.inrialpes.fr/software/...mp/node21.html