IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

échantillonage train test machine learning


Sujet :

R

  1. #1
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Août 2019
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Août 2019
    Messages : 6
    Par défaut échantillonage train test machine learning
    Bonjour,
    j'ai un jeu de données qui contient peu d'observations . afin d'augmenter le nombre d'observations , je veux utiliser les données de 2017 comme une base d'apprentissage train et les données de 2018 pour une base de test sachant que les deux bases contiennent les mêmes variables .
    Ma question est la suivante :
    Est que je peux prendre les deux bases test et train séparément ou je dois les fusionner avant de répartir en base et train

  2. #2
    Membre expérimenté
    Homme Profil pro
    Data scientist
    Inscrit en
    Février 2017
    Messages
    211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data scientist
    Secteur : Conseil

    Informations forums :
    Inscription : Février 2017
    Messages : 211
    Par défaut
    Bonjour,

    Il faut que le train et le test soit séparés ! il ne faut pas oublier de recoder les variables de la même façon dans les deux bases ( même format , même classe de variable , même variable , ect )

    Il faut quand même s'assurer que les données de 2018 et 2017 sont semblables, si c'est pas le cas ton échantillonnage sera biaisé. dans ce cas il faut prendre une partie des données de 2017 et une partie de 2018 dans le train et le test.

  3. #3
    Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Août 2019
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Août 2019
    Messages : 6
    Par défaut
    Merci pour votre réponse

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Algorithme machine learning
    Par a1331 dans le forum Développement
    Réponses: 2
    Dernier message: 08/04/2013, 10h14
  2. Machine learning and Kernels: traduction en français ?
    Par Alexis.M dans le forum Algorithmes et structures de données
    Réponses: 5
    Dernier message: 30/07/2012, 18h23
  3. train test split
    Par nounouuuuu201186 dans le forum Intelligence artificielle
    Réponses: 17
    Dernier message: 07/03/2012, 16h54
  4. [solve] no load test machine asynchrone
    Par tetrapower dans le forum MATLAB
    Réponses: 5
    Dernier message: 14/11/2011, 11h14
  5. Machine Learning Repository
    Par kenza28684 dans le forum JDBC
    Réponses: 0
    Dernier message: 27/04/2009, 22h58

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo