IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Un problème statistique simple - Mon raisonnement a-t-il une faille ?


Sujet :

Statistiques, Data Mining et Data Science

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Novembre 2012
    Messages
    27
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2012
    Messages : 27
    Points : 10
    Points
    10
    Par défaut Un problème statistique simple - Mon raisonnement a-t-il une faille ?
    Bonjour,

    Je ne suis pas du tout versé dans l'art statistique, le vocabulaire employé ne sera donc pas exact.

    Je cogite sur le problème suivant:

    Deux sondages différents disent :
    - 1er: A la question "aimez-vous le chocolat" 80% des martiens répondent OUI, 20% répondent NON
    -2ème: A la question "aimez-vous les fraises" 20% des martiens répondent OUI, 80% répondent NON

    Les sondages sont présentés comme "L'avis des martiens sur ..." ou "Les martiens aiment ..." bref une généralité.


    Mon "analyse" :

    Les échantillons interrogés ne sont pas les mêmes personnes mais de ces sondages sortent deux statistiques générales.
    1er sondage: A 80% NonA 20%
    2ème sondage: B 80% NonB 20%

    Il peut y avoir quatre combinaisons :
    - A&B
    - A&NonB
    - NonA&B
    - NonA&NonB

    Pour ma part, la distribution de ses combinaisons peut être la suivante:
    - A&B pour 60% de la population
    - A&NonB + NonA&B + NonA&NonB pour 40% avec une impossibilité de distribuer plus finement.


    Ma logique est-elle bonne ou y-a-t-il une grosse faille ?

    Merci d'avance !

  2. #2
    Membre actif
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Juillet 2018
    Messages
    95
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Tarn (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels

    Informations forums :
    Inscription : Juillet 2018
    Messages : 95
    Points : 212
    Points
    212
    Par défaut
    Bonjour,

    Citation Envoyé par Richelsdorfite Voir le message
    Bonjour,

    Je ne suis pas du tout versé dans l'art statistique, le vocabulaire employé ne sera donc pas exact.
    [...]
    Il peut y avoir quatre combinaisons :
    - A/B
    - A/NonB
    - NonA/B
    - NonA/NonB
    Justement là j'ai un doute sur les "/". Soit vous considérez que c'est l'intersection, soit que c'est "privé de", dans quel cas ce sera plutôt "\". Vu vos propositions qui suiventje considérerai que c'est "privé de" que vous considériez.

    Et ma réponse est qu'il n'y a pas assez de données dans l'énoncé pour répondre à ces questions.
    On peut avoir:
    Les martiens qui aiment les fraises sont strictement compris dans les martiens qui aiment le chocolat, dans quel cas on à (A\B) pour 60% de la population.
    Mais on peut aussi avoir:
    Les martiens qui aiment les fraises sont exactement ceux qui n'aiment le chocolat, dans quel cas on à (A\B) pour 80% de la population.
    Et on peut avoir d'autres situations intermédiaires...

  3. #3
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    Décembre 2013
    Messages
    4 053
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2013
    Messages : 4 053
    Points : 9 392
    Points
    9 392
    Par défaut
    La répartition la plus 'probable' est celle obtenue en faisant des multiplications.

    A = 80% ; B = 80% donc A et B en même temps = 80%*80% = 64%
    A = 80% ; nonB = 20% donc A et NonB = 80%*20% = 16%
    nonA = 20% ; B = 80% donc nonA et B = 20%*80% = 16%
    nonA = 20% ; nonB = 20% donc nonA et nonB = 20%*20% = 4%

    Et on constate que la somme fait bien 100%.

    En termes mathématiques, faute d'informations supplémentaires , on suppose que les 2 propositions sont indépendantes.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  4. #4
    Membre à l'essai
    Profil pro
    Inscrit en
    Novembre 2012
    Messages
    27
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2012
    Messages : 27
    Points : 10
    Points
    10
    Par défaut
    Citation Envoyé par AbsoluteLogic Voir le message
    Justement là j'ai un doute sur les "/". Soit vous considérez que c'est l'intersection, soit que c'est "privé de", dans quel cas ce sera plutôt "\". Vu vos propositions qui suiventje considérerai que c'est "privé de" que vous considériez.
    J'ai remplacé le / par & qui se lit A ET B et dans le cas présent : Aiment le chocolat et n'aiment pas les fraises.

    Citation Envoyé par tbc92 Voir le message
    En termes mathématiques, faute d'informations supplémentaires , on suppose que les 2 propositions sont indépendantes.
    Cela a été ma première lecture, je l'ai abandonnée car je supposais que j'avais affaire à une intersection d'ensembles distincts.

  5. #5
    Membre du Club
    Homme Profil pro
    Statistique
    Inscrit en
    Octobre 2014
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 39
    Localisation : France, Jura (Franche Comté)

    Informations professionnelles :
    Activité : Statistique

    Informations forums :
    Inscription : Octobre 2014
    Messages : 33
    Points : 48
    Points
    48
    Par défaut
    Bonjour.

    Il est peut-être un peu tard pour répondre à votre question mais dans le doute vous je le fais quand même.

    Comme vous le dite vous-même vous avez obtenu des résultats (A = 80*%, NonA = 20%, B = 20%, NonB = 80%) sur des échantillons de Martiens.

    Quand vous dites «peut-être que la répartition est - A&B pour 60% de la population
    et A&NonB + NonA&B + NonA&NonB pour 40%» vous parlez de la population générale des Martiens je pense.

    Je vous dirais que tout est possible concernant la population générale des Martiens. Il est notamment possible qu’en fait seuls 20% des Martiens aiment le chocolat et 80% aiment les fraises.

    Cependant tout n’est pas possible avec la même probabilité. Et le plus probable est qu’effectivement le goût soit réparti dans la population générale comme dans vos échantillons.

    Par ailleurs plus vos échantillons sont gros et plus la probabilité qu’effectivement 80% des Martiens aiment le chocolat et 20% les fraises augmentent. Ou plutôt, plus vos échantillons sont gros plus il est probable que le pourcentage de martiens qui aiment le chocolat en population générale soit proche des résultats de vos sondages.

    Enfin pour la question de l’indépendance entre «aimer les fraise» et «aimer les chocolat». On a aucune données ici pour supposer que ces événements sont indépendants ou non. En se fiant à la seul logique je dirais que ces événements ne sont pas indépendants car il s’agit de deux ingrédient sucrés.
    En tout cas si vous aviez réalisé une telle étude en interrogeant des Martiens sur les chocolat et d’autre sur les fraises pour finalement vous demander si c’est indépendant ou non, on vous demandera pourquoi diantre vous n’avez pas posé les deux questions aux Martiens que vous croisiez.

    Pour finir, si vous avez interrogé l’ensemble des Martiens, que vous obtenez 80% d’amateur de chocolat et 20% d’amateur de fraise. Alors la proportion de Martiens qui aiment les chocolat et pas les fraise (votre A&B) est entre 60% (si tous les Martiens qui aiment les fraise aiment le chocolat) et 80% (si tout les martiens qui aiment les fraise n’aime pas les chocolats). Avec 64% en cas d’indépendance comme dit tbc92. (Je miserais sur moins que 64% dans ce cas personnellement puisque comme dit plus haut, à mon sens, le fait d’aimer un ingrédient sucré augmente les chance d’aimer l’autre).

    Voilà*:-)
    Cordialement

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 2
    Dernier message: 03/04/2011, 11h55
  2. problème apostrophes simple et double
    Par dor_boucle dans le forum Langage
    Réponses: 9
    Dernier message: 20/02/2006, 13h48
  3. problème statistiques bilan
    Par tibiurs dans le forum Access
    Réponses: 6
    Dernier message: 24/01/2006, 18h41
  4. [Débutant] Requête statistique simple
    Par drthodt dans le forum Requêtes et SQL.
    Réponses: 8
    Dernier message: 14/10/2005, 09h50
  5. [Débutant] Problème servlet simple
    Par davycrocket dans le forum Servlets/JSP
    Réponses: 7
    Dernier message: 30/06/2004, 09h24

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo