A priori, cela va être difficile d'exploiter le schéma directeur d'un arbre de décision dans une forêt aléatoire. De plus, je ne suis pas sûr que cela ait un grand intérêt puisque cela revient finalement à exploiter un modèle simple dans un modèle qui lui est supérieur. Dans l'absolu, tu peux visualiser une forêt aléatoire mais elle va être difficile à interpréter. Après réflexion, il doit tout de même être possible de fusionner plusieurs arbres ensemble pour obtenir un nombre plus limité d'arbres de décision, mais équivalent à la forêt initiale. Cela dit, je ne pense que cela ait été fait pour le moment. Tu peux t'intéresser au problème, il est loin d'être inintéressant.
Je me souviens que tu avais également utilisé les rotation forests dans Weka. Je ne connais pas bien cette méthode mais je crois me souvenir que les ensembles de variables sont disjoints d'un arbre à l'autre (contrairement aux random forests). Si c'est le cas, la visualisation risque d'être plus simple et surtout plus facilement interprétable. C'est peut-être une bonne piste. Il me semble que les rotation forests ont été faites par Kuncheva et al : il faudrait examiner l'article pour vérifier tout cela. En plus, du point de vue des performances, tu risques d'être gagnant.
Partager