IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Échantillon aléatoire avec poids


Sujet :

R

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Août 2010
    Messages
    17
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 17
    Points : 15
    Points
    15
    Par défaut Échantillon aléatoire avec poids
    Bonjour à tous,

    J'ai une très grosse base de données que j'essaie de réduire en tirant aléatoirement des individus dedans. Dans la base finale je souhaite que les poids de la population - selon une caractéristique seulement - soit respectés. Cette caractéristique vaut 0 ou 1 et correspond par exemple au fait d'habiter à Paris. Je souhaite que ma base finale soit un échantillon aléatoire de la base initiale qui respecte la proportion de parisiens dans la base totale.

    J'ai réussi à coder la création de cette base mais je n'arrive pas à inclure de poids dedans, je ne vois pas vraiment comment faire ... Une idée ?

    Pour se faire, j'ai séparé ma base initiale en 2 bases : parisiens vs non parisiens et à l'intérieur de celles-ci je tire 500 individus au hasard. Je regroupe ensuite les 2 bases.

    Merci d'avance

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
     
    Base.paris<-Base[is.element(Base$paris,c(1)), ]
    Base.nonparis <- Base[is.element(Base$paris,c(0)), ]
     
    ssbase_paris<- Base.paris[sample(1:n_paris, 500, replace=T), ]
    ssbase_paris[1:10,]
     
    ssbase_nonparis <- Base.nonparis[sample(1:n_nonparis, 500, replace=T), ]
    ssbase_nonparis[1:10,]
     
    mysampledataset <- rbind(ssbase_paris, ssbase_nonparis )

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Pouvez-vous donner plus de précisions sur les objectifs que vous souhaitez obtenir ?

    En effet, si j'ai bien compris le problème, en prenant des valeurs d'exemple, vous voulez tirer un échantillon aléatoire de 100 individus dans votre base de données globale (de 10000 individus par exemple) qui vérifie les conditions suivantes : 30 % de parisiens et 70 % de non parisiens.
    Est-ce bien cela ?

    Si oui, je pense que votre solution est un bon départ, vous séparez en deux sous-populations ("parisiens" et "non parisiens") et par exemple pour la population de "parisiens", vous faite une sélection aléatoire avec : Base.paris[sample(1:n_paris, 30 , replace=F), ].

    Je ne sais pas si cela répond vraiment à votre question ? Sinon n'hésitez pas à donner plus de précisions !

    Bonne continuation


    Cordialement,


    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

Discussions similaires

  1. créer un fchier aléatoire avec un nom unique
    Par hansaplast dans le forum Langage
    Réponses: 2
    Dernier message: 20/10/2006, 15h37
  2. Récupérer une ligne aléatoire avec fgets
    Par Alexbad dans le forum C
    Réponses: 20
    Dernier message: 30/07/2006, 23h53
  3. Selection aléatoire avec rand
    Par Ruddy16 dans le forum Requêtes
    Réponses: 4
    Dernier message: 06/12/2005, 10h01
  4. Affichage aléatoire avec coéfficients
    Par groupejtt dans le forum EDI, CMS, Outils, Scripts et API
    Réponses: 4
    Dernier message: 08/11/2005, 22h09

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo