IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

Importance du nombre d'observations dans une analyse de régression


Sujet :

Méthodes prédictives

  1. #1
    Futur Membre du Club
    Homme Profil pro
    géotechnique
    Inscrit en
    Octobre 2015
    Messages
    11
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Cameroun

    Informations professionnelles :
    Activité : géotechnique
    Secteur : Bâtiment Travaux Publics

    Informations forums :
    Inscription : Octobre 2015
    Messages : 11
    Points : 8
    Points
    8
    Par défaut Importance du nombre d'observations dans une analyse de régression
    Bonjour,
    J'aimerais savoir s'il existe des travaux scientifiques (Articles, livres, etc) qui démontrent l'influence ou l'importance du nombre d'observations (nombre d'échantillons) pour une analyse de régression.
    Merci

  2. #2
    Membre averti
    Profil pro
    Inscrit en
    Février 2010
    Messages
    267
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 267
    Points : 367
    Points
    367
    Par défaut loi de shannon
    Bonjour,
    la loi de shannon sur un échantillonnage donne une reconstruction du signal avec la moitié des maximum . Partant de ce principe , on a une idée que la moitié des observations suffisent pour l'étude de la déviation . Suffit de regarder une gaussienne

  3. #3
    Futur Membre du Club
    Homme Profil pro
    géotechnique
    Inscrit en
    Octobre 2015
    Messages
    11
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Cameroun

    Informations professionnelles :
    Activité : géotechnique
    Secteur : Bâtiment Travaux Publics

    Informations forums :
    Inscription : Octobre 2015
    Messages : 11
    Points : 8
    Points
    8
    Par défaut
    En fait j'aimerais réaliser une regression multiparamétrique et déterminer un R2. Une analyse précédente à été réalisée avec un jeux de 30 données (observations). J'aimerais démontrer qu'en augmentant les données (150 données) le modèle obtenu a plus de poids et de sens.

  4. #4
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 054
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 054
    Points : 9 394
    Points
    9 394
    Par défaut
    Le modèle a plus de poids avec 150 données qu'avec 30. C'est évident.
    Et avec 1000, il en a encore plus.

    Si on veut par exemple estimer l'êge moyen d'un groupe de 10000 personnes, plus on sonde un nombre élevé de personnes, plus on aura une estimation précise de cet âge moyen. Si tu prends un cours de statistiques, tu auras les formules toutes faites.
    La question, c'est de voir si une estimation avec un risque d'erreur de 1 mois, ou une estimation avec un risque d'erreur de 3 mois c'est fondamentalement différent.
    Si je me souviens bien de mes cours, en gros, en multipliant le nombre de personnes sondées par k, on divise l'intervalle de confiance par k.

    Du coup, j'imagine un peu ton contexte .... tu dis qu'avec plus de données, tu auras des résultats plus précis. Mais ton interlocuteur, il sait que pour avoir plus de données, ça va coûter plus d'argent.

    Et s'il a besoin d'une estimation, pas forcément très précise, il n'a pas envie de dépenser des fortunes, pour collecter des tas d'informations, pour améliorer la précision un tout petit peu.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  5. #5
    Membre averti
    Profil pro
    Inscrit en
    Février 2010
    Messages
    267
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 267
    Points : 367
    Points
    367
    Par défaut Intervalle de confiance
    Justement il faut utiliser l'intervalle de confiance pour encadrer les résultats et confirmer le nombre d'observation. Sachant que qu'une loi binomiale peut être avoir une approximation par une gaussie´ne . Pour k succès parmi n observations avec une probabilité de succès k
    http://mistis.inrialpes.fr/software/...mp/node21.html

Discussions similaires

  1. Réponses: 7
    Dernier message: 04/10/2005, 18h21
  2. Réponses: 8
    Dernier message: 20/06/2005, 15h10
  3. Compter nombre de mots dans une chaîne.
    Par xVINCEx dans le forum C++
    Réponses: 22
    Dernier message: 24/11/2004, 13h33
  4. [VB6]PB d'importation d'un feuille Excel dans une MSFlexGrid
    Par mystere l dans le forum VB 6 et antérieur
    Réponses: 18
    Dernier message: 20/04/2004, 15h59
  5. recherche du nombre d'occurences dans une table
    Par berry dans le forum Requêtes
    Réponses: 3
    Dernier message: 09/01/2004, 20h03

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo