Bonjour,

J'ai réalisé un random forest sur 216 variables issues d'indices de végétation provenant d'images aériennes, afin de savoir quelles variables sont les plus déterminantes pour répartir les échantillons en deux classes : forets de conifères ou de feuillus. A la fin j'ai ce graphique :


J'ai bien compris qu'il s'agit de la hiérarchie des variables dont le retrait signifierait la plus grande baisse dans la précision de la classification et la pureté des noeuds finaux. Seulement je ne comprends les valeurs en abscisses : Que signifie la valeur de 4 pour NDWI_dec sur MeanDecreaseGini ? J'ai d'abord cru que c'était des pourcentages mais la somme des valeurs des 216 variables ne fait pas 100.

Nom : plot_importance_variables.png
Affichages : 81
Taille : 19,4 Ko