Bonjour,
après une recherche sur internet j'ai trouvé la notion d'élagage dans l'application de l'arbre de décision
en effet, je n'ai pas compris l'utilisation de la démarche à suivre et quand est ce que on l'applique.
Bon ce que j'ai compris des fois l'arbre de décision nous donne plusieurs feuilles donc on utilise l'élagage pour réduire le nombre des noeuds c'est ça ?
en fait je ne comprend pas le résultat de la fonction printcp et comment l'utiliser dans l'élagage ?
j'ai eu le résultat suivant
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Regression tree:
rpart(formula = y ~ ., data = données)
 
Variables actually used in tree construction:
[1] energie longueur    
 
Root node error: 11568/46274 = 0.25
 
n= 46274 
 
        CP nsplit rel error   xerror       xstd
1 0.925616      0  1.000000 1.000101 2.1442e-05
2 0.039742      1  0.074384 0.077443 2.4745e-03
3 0.010000      2  0.034642 0.033709 1.6694e-03
sachant que ma base comprte 68 variables et 46274 individus
Merci infiniment d'avance pour toute réponse