IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Comment deviner les biais des réponses à un sondage ?


Sujet :

Statistiques, Data Mining et Data Science

  1. #1
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2017
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2017
    Messages : 2
    Points : 1
    Points
    1
    Par défaut Comment deviner les biais des réponses à un sondage ?
    Bonjour à tous !

    Je suis alternant en Business Intelligence et je me suis récemment vu confier un nouveau projet.

    Je dois interroger un panel de 600 personnes en envoyant un mail général. Nous savons que seuls environ 100 personnes vont répondre, et le reste va ignorer notre demande.

    En appelant personnellement certaines personnes, nous obtiendrons environ 50 réponses de plus. Le reste du panel ne répondra pas.


    J'aurai dont les résultats de 100 personnes + 50 personnes. Sachant que ceux qui répondent sont bien souvent ceux qui ont les meilleurs résultats (les "bons élèves").

    Comment faire une approximation la plus proche possible de la réalité pour les 450 autres personnes ?

    J'ai pensé à faire la moyenne des 100 premières personnes (imaginons que la moyenne de la réponse à ma question soit 5), puis des 50 autres (imaginons que la moyenne soit 3.8, logiquement un peu moins bonne que les 100 premiers élèves). Y a-t-il un moyen de faire une approximation de la moyenne des 450 autres ?

    Je ne sais pas si je me suis exprimé correctement ou même si je suis au bon endroit pour exposer mon problème.

    Merci d'avance pour votre aide.

    Cdlt,
    Antoine

  2. #2
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 051
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 051
    Points : 9 386
    Points
    9 386
    Par défaut
    Tentons une réponse.
    Les 100 premières réponses sont effectivement biaisées. On est donc tenté de faire un premier calcul en se limitant aux 50 dernières réponses.
    Mais, ce 2ème échantillon est lui aussi biaisé. On avait 600 personnes au départ. On a 'retiré' 100 personnes, plutôt parmi les meilleures, et on a sondé 50 personnes au hasard parmi les 500 restantes. Pour rattraper le coup, comme on a sondé 50 personnes sur les 500 restantes, il faut aussi prendre au hasard 10 personnes parmi les 100 'répondants volontaires', ce qui nous fait 60 personnes sondées : 10% des volontaires, et 10% des non-volontaires également.
    Sur ces 60 personnes, on peut calculer une moyenne et un écart-type. Ca va nous donner notre résultat final.
    Et on peut vérifier si les 90 autres volontaires sont compatibles avec ces premiers résultats. Au cas où.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Février 2010
    Messages
    266
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 266
    Points : 366
    Points
    366
    Par défaut Intervalle de confiance
    Il suffit de calculer la gaussienne avec l'intervalle de confiance confiance avec la probabilité supérieure à 99% . Il faut prendre son pourcentage
    le pourcentage doit avoir un intervalle de confiance de 99% ie , on calcul la probabilité pi( p> 99%) = 2pi(t)-1 donc t-square(sigma) <p < t+ square(sigma)
    pour 99% c'est 2.05 donc p*1.29/square(effectif) - p => biais statistique

  4. #4
    Nouveau Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Décembre 2017
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 28
    Localisation : France, Val d'Oise (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Décembre 2017
    Messages : 2
    Points : 1
    Points
    1
    Par défaut
    Citation Envoyé par tbc92 Voir le message
    Tentons une réponse.
    Les 100 premières réponses sont effectivement biaisées. On est donc tenté de faire un premier calcul en se limitant aux 50 dernières réponses.
    Mais, ce 2ème échantillon est lui aussi biaisé. On avait 600 personnes au départ. On a 'retiré' 100 personnes, plutôt parmi les meilleures, et on a sondé 50 personnes au hasard parmi les 500 restantes. Pour rattraper le coup, comme on a sondé 50 personnes sur les 500 restantes, il faut aussi prendre au hasard 10 personnes parmi les 100 'répondants volontaires', ce qui nous fait 60 personnes sondées : 10% des volontaires, et 10% des non-volontaires également.
    Sur ces 60 personnes, on peut calculer une moyenne et un écart-type. Ca va nous donner notre résultat final.
    Et on peut vérifier si les 90 autres volontaires sont compatibles avec ces premiers résultats. Au cas où.
    Merci pour ta réponse. Je comprends parfaitement le raisonnement, cela peut effectivement me donner une idée globale des réponses. En revanche, je ne sais pas si la précision est très bonne.

    Merci pour ta réflexion.

Discussions similaires

  1. Comment fonctionnent les index des options d'un select ?
    Par pekka77 dans le forum Général JavaScript
    Réponses: 1
    Dernier message: 31/10/2005, 18h05
  2. Réponses: 27
    Dernier message: 07/10/2005, 10h19
  3. Comment dééfinir les valeurs des abscisses en Time ?
    Par marsupilami34 dans le forum Langage
    Réponses: 1
    Dernier message: 29/09/2005, 15h50
  4. Comment fixer les largeurs des colonnes d'un TStrinGrid
    Par marsupilami34 dans le forum Composants VCL
    Réponses: 6
    Dernier message: 24/08/2005, 13h24
  5. Comment obtenir les Handles des boutons systèmes de Windows ?
    Par Desraux dans le forum API, COM et SDKs
    Réponses: 6
    Dernier message: 22/12/2004, 22h20

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo