Bonjour,
après une recherche sur internet j'ai trouvé la notion d'élagage dans l'application de l'arbre de décision
en effet, je n'ai pas compris l'utilisation de la démarche à suivre et quand est ce que on l'applique.
Bon ce que j'ai compris des fois l'arbre de décision nous donne plusieurs feuilles donc on utilise l'élagage pour réduire le nombre des noeuds c'est ça ?
en fait je ne comprend pas le résultat de la fonction printcp et comment l'utiliser dans l'élagage ?
j'ai eu le résultat suivant
sachant que ma base comprte 68 variables et 46274 individus
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14 Regression tree: rpart(formula = y ~ ., data = données) Variables actually used in tree construction: [1] energie longueur Root node error: 11568/46274 = 0.25 n= 46274 CP nsplit rel error xerror xstd 1 0.925616 0 1.000000 1.000101 2.1442e-05 2 0.039742 1 0.074384 0.077443 2.4745e-03 3 0.010000 2 0.034642 0.033709 1.6694e-03
Merci infiniment d'avance pour toute réponse
Partager