Bonjour à tous,
Après apprentissage et test d'un modèle de classification (random forest), je n'arrive pas à afficher la matrice de confusion, la fonction pour cela m'affiche un message d'erreur.
Voici le code utilisé (Désolé pour la mise en forme du code, la barre de menue ne s'affiche pas chez moi je ne sais pourquoi !!) :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19 train <- read.csv("training.csv") test <- read.csv("testing.csv") library(caret) set.seed(42) trainctrl <- trainControl(method = "cv", number = 10, verboseIter = TRUE) set.seed(42) rf.model <- train(class~., data=train, method = "ranger", tuneLength = 10, num.trees = 500, preProcess = c("center", "scale"), trControl = trainctrl, metric="Kappa") rf.predict <- predict(rf.model, test) confusionMatrix(rf.predict, test$class)Error: `data` and `reference` should be factors with the same levels.
Je ne comprends pas ce message d'erreur.
Merci pour votre aide.
Vous trouverez le code complet dans le lien ci-dessous dans la rubrique Supplemental Material à la fin de l'article :
https://www.tandfonline.com/doi/full...1.2018.1433343
Le jeu de données utilisé dans :
https://archive.ics.uci.edu/ml/datas...ban+Land+Cover
J'utilise R-4.2.1 avec la dernière version de RStudio sous windows 7 service packe 1.
Partager