Utiliser la méthode de validation croisée à k plis

**medchok** · 12/03/2016, 00h30

Bonjour à tous

Le débat http://www.developpez.net/forums/d99...roisee-k-plis/ étant très enrichissant, j'espère retrouver les mêmes intervenants même si c'est avec un retard énorme.

Dans un grand jeu de données, le cadre des données déséquilibrées est très intéressant, seriez-vous, alors, pour une division de l'ensemble des données en 3 (apprentissage, validation, test), pour un k-fold ou du bootstrap, ...?

Autre point important, comment construire les sous-échantillons (mise à part la question de leurs nombres) : seriez-vous pour une construction à partir d'un choix aléatoire sur l'ensemble des données pris dans sa totalité ou plutôt par une double sélection aléatoire s'opérant en parallèle sur les deux parties "minoritaire" et "majoritaire" des données (encore faut-il voir dans quelle proportions)?

Espérant trouver des éléments de réponse.

**medchok** · 14/04/2016, 10h25

Bonjour,

Espérant trouver une esquisse de réponse, je vais essayer de reformuler un peu mes interrogations:

Dans le cadre d'un algorithme utilisant l'apprentissage, y aurait il des recommandations pour une division de l'ensemble des données en 3 (apprentissage, validation, test), pour un k-fold ou du bootstrap, ...? Si oui, y en aurait il selon les cas?

Vous remerciant pour vôtre aide.

Utiliser la méthode de validation croisée à k plis

Méthodes prédictives

Discussions similaires

Partager

Partager