IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Sélectionner un échantillon représentatif


Sujet :

Statistiques, Data Mining et Data Science

  1. #1
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Février 2015
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Février 2015
    Messages : 2
    Points : 4
    Points
    4
    Par défaut Sélectionner un échantillon représentatif
    Bonjour,

    suite à ma présentation je vous expose mon problème. Je travaille actuellement, en tant qu’étudiant, dans une industrie de production et ma mission m’emmène à devoir sélection un échantillon le plus représentatif possible d'une population. Cet échantillons une fois déterminé subira des tests qui devront être des conclusions fiables pour l'ensemble de la population en question.

    Je vous présente mes données à échantillonner (taille de l'échantillon : 10 pièces) :



    Chaque individu est classé selon 2 critères :
    - une classe : il est représentatif de la qualité, chaque classe est divisée en 3 sous classes (ex : O- < O= < O+< P-< P= < P+ < R- < R= < R+...etc)
    - un chiffre : de 1 à 5 il correspond à une concentration (teneur)

    J'ai pour ma part déterminé les % pour déterminer la proportion de leur présence, mais elles sont difficilement applicables à un échantillon de 10 individus.

    Selon vous quelle serait la méthode la plus fiable et donc la mieux adaptées?

    Merci d'avance

  2. #2
    Rédacteur/Modérateur

    Avatar de yahiko
    Homme Profil pro
    Développeur
    Inscrit en
    Juillet 2013
    Messages
    1 423
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Alpes Maritimes (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Développeur

    Informations forums :
    Inscription : Juillet 2013
    Messages : 1 423
    Points : 8 700
    Points
    8 700
    Billets dans le blog
    43
    Par défaut
    En aucune manière 10 individus peuvent être considérés comme représentatifs d'une population.
    Tutoriels et FAQ TypeScript

  3. #3
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Février 2015
    Messages
    2
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 31
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Février 2015
    Messages : 2
    Points : 4
    Points
    4
    Par défaut
    Oui je m'en doute bien, j'ai essayé de faire au mieux avec ces moyens. Il serait compliqué dans ce projet d'en sélectionné plus de 10. Merci de ta raison

  4. #4
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut
    bon, à première vue je pense que le problème est un peu mal posé, mais allons-y quand même :

    dans la table on remarque que :

    • Dans la classe 0 il y a 2 aggrégats significatifs, l'un à (O-2 & O-3), l'autre à (O2 & O3). Le (O-2 & O-3) est le plus fort
    • Dans la classe P il y a 2 aggrégats signifcatifs, l'un à (P-2 & P-3), l'autre à (P2 & P3). Le (P2 & P3) est le plus fort
    • le R ne donne rien
    • La classe P représente 89% du total, et la classe O 10.8%



    J'aurais donc tendance à dire que 2 individus devraient correspondrent aux classes P2 et P3. Avec ça on couvre 89% de "description", si on admet que cela repésente la classe P (presque 50% d'une classe qui fait 89%). Si on veut plus de précision, on prend 2 individus des classes (P-2 & P-3) (plus de 95% d'une classe qui fait 89%). Et enfin si on veut rajouter encore, on ajoute 2 individus de la classe (O-2 & O-3) .. Et enfin, pour décrire presque la totalité, on prend 2 individus des classes (O2 & O3).

    Mais je dois avoir mal compris quelque chose
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

  5. #5
    Candidat au Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Février 2015
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 33
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : High Tech - Multimédia et Internet

    Informations forums :
    Inscription : Février 2015
    Messages : 5
    Points : 3
    Points
    3
    Par défaut
    Bonjour,

    Moi je regarderais vers les arbres de décision et calcul d'indice d'impureté de Gini. Avec ça tu peux identifier quel paramètre est le plus imortant et avec quelle couverture de population (même si ici les résultats peuvent être biaisé par un échantillon du fait du nombre assez réduits de valeurs).

    Vincent

  6. #6
    Responsable SAS


    Inscrit en
    Septembre 2006
    Messages
    3 176
    Détails du profil
    Informations forums :
    Inscription : Septembre 2006
    Messages : 3 176
    Points : 16 219
    Points
    16 219
    Par défaut
    Bonjour,
    La représentativité de ton échantillon ne peut être testée que si tu connais la structure de ta population, via un test d'adéquation.
    Cordialement,
    Les balises code
    FAQ SAS
    Rubrique SAS

    Si vous souhaitez contribuer à la rubrique SAS, contactez-moi ou tout autre membre de l'équipe BI par MP.

Discussions similaires

  1. Méthode de calcul d'un échantillon représentatif
    Par auredura dans le forum SAS STAT
    Réponses: 5
    Dernier message: 24/04/2009, 19h12
  2. sélectionner un répertoire
    Par estelle dans le forum Balisage (X)HTML et validation W3C
    Réponses: 7
    Dernier message: 02/09/2005, 04h53
  3. Pré-sélectionner un élément d'une combobox
    Par delphim dans le forum Composants VCL
    Réponses: 4
    Dernier message: 17/06/2003, 15h26
  4. Recuperation du texte sélectionné
    Par jm barbou dans le forum C++Builder
    Réponses: 2
    Dernier message: 13/11/2002, 08h13
  5. Réponses: 9
    Dernier message: 12/08/2002, 07h38

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo