Salut la commu,
J'ai conçu un outil de prédiction se basant sur les concepts du Machine Learning et notamment avec les méthodes RandomForest.
Tout roule comme je veux, sauf que dans un soucis d'amélioration et pérennité du modèle je cherche à pouvoir augmenter la taille de mon jeu d'entrainement (ajouter des individus) sans avoir à recharger entièrement le modèle. (Temps de traitement trop long !)
J'ai donc deux questions qui permettrai de résoudre mon problème:
- Comment ajouter des individus au modèle sans le recharger entièrement ?
- Y a t-il un moyen d'améliorer les temps de création de modèles ?
Création du modèle :
Je suis sur des jeux de 2000 individus et 15000 variables.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 fit_bagging <- randomForest(pred~ ., data = train, ntree=200, na.action=na.roughfix)
Problème de classification.
Si quelqu'un pouvait m'aiguiller sur des solutions possibles je prends tous conseils !
Bonne Journée.
Mano
Partager