Importance du nombre d'observations dans une analyse de régression

Version imprimable

21/09/2021, 11h56
aloys thierry

Importance du nombre d'observations dans une analyse de régression

Bonjour,
J'aimerais savoir s'il existe des travaux scientifiques (Articles, livres, etc) qui démontrent l'influence ou l'importance du nombre d'observations (nombre d'échantillons) pour une analyse de régression.
Merci
21/09/2021, 18h32
mach1974

loi de shannon

Bonjour,
la loi de shannon sur un échantillonnage donne une reconstruction du signal avec la moitié des maximum . Partant de ce principe , on a une idée que la moitié des observations suffisent pour l'étude de la déviation . Suffit de regarder une gaussienne
21/09/2021, 19h33
aloys thierry

En fait j'aimerais réaliser une regression multiparamétrique et déterminer un R2. Une analyse précédente à été réalisée avec un jeux de 30 données (observations). J'aimerais démontrer qu'en augmentant les données (150 données) le modèle obtenu a plus de poids et de sens.
21/09/2021, 22h12
tbc92

Le modèle a plus de poids avec 150 données qu'avec 30. C'est évident.
Et avec 1000, il en a encore plus.

Si on veut par exemple estimer l'êge moyen d'un groupe de 10000 personnes, plus on sonde un nombre élevé de personnes, plus on aura une estimation précise de cet âge moyen. Si tu prends un cours de statistiques, tu auras les formules toutes faites.
La question, c'est de voir si une estimation avec un risque d'erreur de 1 mois, ou une estimation avec un risque d'erreur de 3 mois c'est fondamentalement différent.
Si je me souviens bien de mes cours, en gros, en multipliant le nombre de personnes sondées par k, on divise l'intervalle de confiance par k.

Du coup, j'imagine un peu ton contexte .... tu dis qu'avec plus de données, tu auras des résultats plus précis. Mais ton interlocuteur, il sait que pour avoir plus de données, ça va coûter plus d'argent.

Et s'il a besoin d'une estimation, pas forcément très précise, il n'a pas envie de dépenser des fortunes, pour collecter des tas d'informations, pour améliorer la précision un tout petit peu.
01/10/2021, 17h25
mach1974

Intervalle de confiance

Justement il faut utiliser l'intervalle de confiance pour encadrer les résultats et confirmer le nombre d'observation. Sachant que qu'une loi binomiale peut être avoir une approximation par une gaussie´ne . Pour k succès parmi n observations avec une probabilité de succès k
http://mistis.inrialpes.fr/software/...mp/node21.html