Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques et Data Mining Discussion :

Un problème statistique simple - Mon raisonnement a-t-il une faille ?


Sujet :

Statistiques et Data Mining

  1. #1
    Membre à l'essai
    Un problème statistique simple - Mon raisonnement a-t-il une faille ?
    Bonjour,

    Je ne suis pas du tout versé dans l'art statistique, le vocabulaire employé ne sera donc pas exact.

    Je cogite sur le problème suivant:

    Deux sondages différents disent :
    - 1er: A la question "aimez-vous le chocolat" 80% des martiens répondent OUI, 20% répondent NON
    -2ème: A la question "aimez-vous les fraises" 20% des martiens répondent OUI, 80% répondent NON

    Les sondages sont présentés comme "L'avis des martiens sur ..." ou "Les martiens aiment ..." bref une généralité.


    Mon "analyse" :

    Les échantillons interrogés ne sont pas les mêmes personnes mais de ces sondages sortent deux statistiques générales.
    1er sondage: A 80% NonA 20%
    2ème sondage: B 80% NonB 20%

    Il peut y avoir quatre combinaisons :
    - A&B
    - A&NonB
    - NonA&B
    - NonA&NonB

    Pour ma part, la distribution de ses combinaisons peut être la suivante:
    - A&B pour 60% de la population
    - A&NonB + NonA&B + NonA&NonB pour 40% avec une impossibilité de distribuer plus finement.


    Ma logique est-elle bonne ou y-a-t-il une grosse faille ?

    Merci d'avance !

  2. #2
    Membre régulier
    Bonjour,

    Citation Envoyé par Richelsdorfite Voir le message
    Bonjour,

    Je ne suis pas du tout versé dans l'art statistique, le vocabulaire employé ne sera donc pas exact.
    [...]
    Il peut y avoir quatre combinaisons :
    - A/B
    - A/NonB
    - NonA/B
    - NonA/NonB
    Justement là j'ai un doute sur les "/". Soit vous considérez que c'est l'intersection, soit que c'est "privé de", dans quel cas ce sera plutôt "\". Vu vos propositions qui suiventje considérerai que c'est "privé de" que vous considériez.

    Et ma réponse est qu'il n'y a pas assez de données dans l'énoncé pour répondre à ces questions.
    On peut avoir:
    Les martiens qui aiment les fraises sont strictement compris dans les martiens qui aiment le chocolat, dans quel cas on à (A\B) pour 60% de la population.
    Mais on peut aussi avoir:
    Les martiens qui aiment les fraises sont exactement ceux qui n'aiment le chocolat, dans quel cas on à (A\B) pour 80% de la population.
    Et on peut avoir d'autres situations intermédiaires...

  3. #3
    Rédacteur/Modérateur

    La répartition la plus 'probable' est celle obtenue en faisant des multiplications.

    A = 80% ; B = 80% donc A et B en même temps = 80%*80% = 64%
    A = 80% ; nonB = 20% donc A et NonB = 80%*20% = 16%
    nonA = 20% ; B = 80% donc nonA et B = 20%*80% = 16%
    nonA = 20% ; nonB = 20% donc nonA et nonB = 20%*20% = 4%

    Et on constate que la somme fait bien 100%.

    En termes mathématiques, faute d'informations supplémentaires , on suppose que les 2 propositions sont indépendantes.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  4. #4
    Membre à l'essai
    Citation Envoyé par AbsoluteLogic Voir le message
    Justement là j'ai un doute sur les "/". Soit vous considérez que c'est l'intersection, soit que c'est "privé de", dans quel cas ce sera plutôt "\". Vu vos propositions qui suiventje considérerai que c'est "privé de" que vous considériez.
    J'ai remplacé le / par & qui se lit A ET B et dans le cas présent : Aiment le chocolat et n'aiment pas les fraises.

    Citation Envoyé par tbc92 Voir le message
    En termes mathématiques, faute d'informations supplémentaires , on suppose que les 2 propositions sont indépendantes.
    Cela a été ma première lecture, je l'ai abandonnée car je supposais que j'avais affaire à une intersection d'ensembles distincts.

  5. #5
    Nouveau membre du Club
    Bonjour.

    Il est peut-être un peu tard pour répondre à votre question mais dans le doute vous je le fais quand même.

    Comme vous le dite vous-même vous avez obtenu des résultats (A = 80*%, NonA = 20%, B = 20%, NonB = 80%) sur des échantillons de Martiens.

    Quand vous dites «peut-être que la répartition est - A&B pour 60% de la population
    et A&NonB + NonA&B + NonA&NonB pour 40%» vous parlez de la population générale des Martiens je pense.

    Je vous dirais que tout est possible concernant la population générale des Martiens. Il est notamment possible qu’en fait seuls 20% des Martiens aiment le chocolat et 80% aiment les fraises.

    Cependant tout n’est pas possible avec la même probabilité. Et le plus probable est qu’effectivement le goût soit réparti dans la population générale comme dans vos échantillons.

    Par ailleurs plus vos échantillons sont gros et plus la probabilité qu’effectivement 80% des Martiens aiment le chocolat et 20% les fraises augmentent. Ou plutôt, plus vos échantillons sont gros plus il est probable que le pourcentage de martiens qui aiment le chocolat en population générale soit proche des résultats de vos sondages.

    Enfin pour la question de l’indépendance entre «aimer les fraise» et «aimer les chocolat». On a aucune données ici pour supposer que ces événements sont indépendants ou non. En se fiant à la seul logique je dirais que ces événements ne sont pas indépendants car il s’agit de deux ingrédient sucrés.
    En tout cas si vous aviez réalisé une telle étude en interrogeant des Martiens sur les chocolat et d’autre sur les fraises pour finalement vous demander si c’est indépendant ou non, on vous demandera pourquoi diantre vous n’avez pas posé les deux questions aux Martiens que vous croisiez.

    Pour finir, si vous avez interrogé l’ensemble des Martiens, que vous obtenez 80% d’amateur de chocolat et 20% d’amateur de fraise. Alors la proportion de Martiens qui aiment les chocolat et pas les fraise (votre A&B) est entre 60% (si tous les Martiens qui aiment les fraise aiment le chocolat) et 80% (si tout les martiens qui aiment les fraise n’aime pas les chocolats). Avec 64% en cas d’indépendance comme dit tbc92. (Je miserais sur moins que 64% dans ce cas personnellement puisque comme dit plus haut, à mon sens, le fait d’aimer un ingrédient sucré augmente les chance d’aimer l’autre).

    Voilà*:-)
    Cordialement

###raw>template_hook.ano_emploi###