IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SAS STAT Discussion :

conseil pour échantillonnage


Sujet :

SAS STAT

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Mai 2008
    Messages
    103
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2008
    Messages : 103
    Points : 54
    Points
    54
    Par défaut conseil pour échantillonnage
    bonjour

    je voudrais choisir des jeux de données d'une base de données( de plus de 700 jdd) afin d'étudier certains paramètres. Ces jeux de données sont fournis par plusieurs fournisseurs. Certains fournisseurs ont mis plus de Jdd que d'autres.

    pour mon étude, j'ai utiliser le critère de la médiane pour l'echantillonage afin d'éviter l'effet fournisseur, mais voilà que le nombre de jdd ainsi choisi est trop petit (90) comparé à la taille de la base de donnée!!
    ce critère me parait assez restrictif


    Auriez vous un conseil statistique à me donner ?


    Merci.

  2. #2
    Membre actif

    Profil pro
    Inscrit en
    Avril 2008
    Messages
    233
    Détails du profil
    Informations personnelles :
    Âge : 49
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 233
    Points : 254
    Points
    254
    Par défaut
    Pour répondre à ta question il faut avoir un peu plus d'information sur la nature des données et leur utilisation. Que veux-tu faire au juste ?

  3. #3
    Responsable SAS


    Inscrit en
    Septembre 2006
    Messages
    3 176
    Détails du profil
    Informations forums :
    Inscription : Septembre 2006
    Messages : 3 176
    Points : 16 157
    Points
    16 157
    Par défaut
    Bonjour,
    Peux tu préciser ce que tu entends par jeu de données : ligne, base de données?
    Que veux-tu comparer : les fournisseurs?
    Que veux-tu démontrer, analyser, .... quel est le but de ton étude?

  4. #4
    Membre à l'essai
    Profil pro
    CDP
    Inscrit en
    Septembre 2008
    Messages
    23
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : CDP

    Informations forums :
    Inscription : Septembre 2008
    Messages : 23
    Points : 22
    Points
    22
    Par défaut
    Bonjour,

    Si le minimum des jdd est très faible par-rapport au max (variance), et en choisissant ce critère, ton effectif sera trop faible.
    En fait, tu n'as pas trop le choix si encore une fois, tu veux t'affranchir de l'effet fournisseur mais que ton min est trop faible.
    Donc 3 solutions: tu intégres l'effet fournisseur qui est une info en soit ou tu traites tes données fournisseurs par fournisseurs.
    La dernière solution serait de pondérer tes effectifs trop faibles.

    Bon courage

  5. #5
    Membre du Club
    Profil pro
    Inscrit en
    Mai 2008
    Messages
    103
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2008
    Messages : 103
    Points : 54
    Points
    54
    Par défaut
    Merci pour vos réponses!!


    un jeu de données est une étude ayant comme attributs (identifiant fournisseur,identifiant etude, identifiant produit ...). Donc cette base de données contient plusieurs études du même genre.

    je voudrais étudier le comportement d'un certain indice statistique à travers ces études tout fournisseur confonfu (en gros l'estimer et donner un intervalle de confiance).


    Donc 3 solutions: tu intégres l'effet fournisseur qui est une info en soit ou tu traites tes données fournisseurs par fournisseurs.
    La dernière solution serait de pondérer tes effectifs trop faibles.

    Il est vrai que je n'ai pas vraiement le choix , je dois intégrer l'effet fournisseur. Dans ce quel critère choisir??

  6. #6
    Responsable SAS


    Inscrit en
    Septembre 2006
    Messages
    3 176
    Détails du profil
    Informations forums :
    Inscription : Septembre 2006
    Messages : 3 176
    Points : 16 157
    Points
    16 157
    Par défaut
    Bonjour,
    J'ai l'impression que tu veux faire un test de comparaison de moyenne pour ainsi voir si ton indice statistique varie d'une base de données à une autre.
    Juste deux questions : Qu'entends-tu par indice statistique (une colonne d'un de test jeu de données ou une synthèse de l'information d'une colonne de ce même jeux).
    Combien as-tu de jeux de données? Car si tu en as 700 tu ne pourras pas comparer tes 700 bases de données, il faudra que tu fasses des regroupements!!

  7. #7
    Membre du Club
    Profil pro
    Inscrit en
    Mai 2008
    Messages
    103
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2008
    Messages : 103
    Points : 54
    Points
    54
    Par défaut
    Bonjour,

    Citation Envoyé par fafabzh6 Voir le message
    Bonjour,
    J'ai l'impression que tu veux faire un test de comparaison de moyenne pour ainsi voir si ton indice statistique varie d'une base de données à une autre.
    Juste deux questions : Qu'entends-tu par indice statistique (une colonne d'un de test jeu de données ou une synthèse de l'information d'une colonne de ce même jeux).
    Combien as-tu de jeux de données? Car si tu en as 700 tu ne pourras pas comparer tes 700 bases de données, il faudra que tu fasses des regroupements!!
    J'ai bien dit : je travaille sur une seule BDD de contenant plus de 700 JDD

    pour chaque jdd, j'obtiens une estimation de cet indice qui est une synthèse de l'information pour ce même JDD.

  8. #8
    Responsable SAS


    Inscrit en
    Septembre 2006
    Messages
    3 176
    Détails du profil
    Informations forums :
    Inscription : Septembre 2006
    Messages : 3 176
    Points : 16 157
    Points
    16 157
    Par défaut
    Bonjour,
    Peux-tu nous donner un léger extrait de quelques lignes (6-7) de ta base de données, et nous expliquer ce que tu veux comparer par rapport à ces données.

  9. #9
    Membre du Club
    Profil pro
    Inscrit en
    Mai 2008
    Messages
    103
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mai 2008
    Messages : 103
    Points : 54
    Points
    54
    Par défaut
    Citation Envoyé par fafabzh6 Voir le message
    Bonjour,
    Peux-tu nous donner un léger extrait de quelques lignes (6-7) de ta base de données, et nous expliquer ce que tu veux comparer par rapport à ces données.
    Je crois que j'ai tout expliqué en haut, je ne peux pas en dire plus.

    J'ai bien dit : je travaille sur une seule BDD de contenant plus de 700 JDD

    pour chaque jdd, j'obtiens une estimation de cet indice qui est une synthèse de l'information pour ce même JDD.
    l'estimation de l'indice me permet d'obtenir sa distribution.

    Merci!

Discussions similaires

  1. Réponses: 3
    Dernier message: 01/07/2003, 16h04
  2. Conseils pour developper une application avec Oracle
    Par belugha dans le forum Langages de programmation
    Réponses: 5
    Dernier message: 02/06/2003, 16h03
  3. Cherche conseil pour choisir mon orientation.
    Par AslDice dans le forum Débuter
    Réponses: 6
    Dernier message: 24/04/2003, 17h07
  4. Conseils pour poser votre question...
    Par Community Management dans le forum XMLRAD
    Réponses: 0
    Dernier message: 30/01/2003, 16h58
  5. [web] Cherche un conseil pour un livre perl-tk
    Par Anonymous dans le forum Interfaces Graphiques
    Réponses: 2
    Dernier message: 29/04/2002, 15h35

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo