IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Méthodes prédictives Discussion :

Jeux de données d'entraînement et de test


Sujet :

Méthodes prédictives

  1. #1
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Août 2019
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Août 2019
    Messages : 6
    Points : 8
    Points
    8
    Par défaut Jeux de données d'entraînement et de test
    Bonjour,
    j'ai un jeu de données qui contient peu d'observations . afin d'augmenter le nombre d'observations , je veux utiliser les données de 2017 comme une base d'apprentissage train et les données de 2018 pour une base de test sachant que les deux bases contiennent les mêmes variables .
    Ma question est la suivante :
    Est que je peux prendre les deux bases test et train séparément ou je dois les fusionner avant de répartir en base et train

  2. #2
    Responsable Qt & Livres


    Avatar de dourouc05
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Août 2008
    Messages
    26 618
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2008
    Messages : 26 618
    Points : 188 591
    Points
    188 591
    Par défaut


    Si tes deux années suivent la même distribution de probabilité (pour parler en termes théoriques), c'est-à-dire si les données "ont la même gueule" (pas de classe surreprésentée une année et pas l'autre, par exemple), tu peux procéder comme ça. Avoir les mêmes colonnes n'est pas suffisant (tu risques d'avoir une évaluation complètement faussée de ton modèle). Sinon, tu fusionnes toutes tes données, puis tu as plus de flexibilité : par exemple, 80 % d'entraînement et 20 % de test, validation croisée.
    Vous souhaitez participer aux rubriques Qt (tutoriels, FAQ, traductions) ou HPC ? Contactez-moi par MP.

    Créer des applications graphiques en Python avec PyQt5
    Créer des applications avec Qt 5.

    Pas de question d'ordre technique par MP !

  3. #3
    Futur Membre du Club
    Homme Profil pro
    Étudiant
    Inscrit en
    Août 2019
    Messages
    6
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Août 2019
    Messages : 6
    Points : 8
    Points
    8
    Par défaut
    Merci beaucoup pour votre réponse

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [2008] Serait il possible de créer un jeux de données
    Par la_fouine1806 dans le forum SSAS
    Réponses: 2
    Dernier message: 14/04/2011, 17h18
  2. Trouver des jeux de données
    Par openlife dans le forum Autres
    Réponses: 0
    Dernier message: 22/09/2009, 16h19
  3. Jeux de données datamining
    Par Darkcristal dans le forum Conception/Modélisation
    Réponses: 3
    Dernier message: 25/02/2008, 22h01
  4. tableau croise avec plusieurs jeux de données
    Par ecayuno dans le forum BIRT
    Réponses: 1
    Dernier message: 09/08/2007, 15h03

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo