1 pièce(s) jointe(s)
Sélection de variables pour l'analyse discriminante
Bonjour,
Je souhaite faire une analyse discriminante linéaire mais j'ai trouvé un problème lors de la sélection des variables afin d'intégrer uniquement les variables pertinentes:
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
|
> library(klaR)
> library(MASS)
> #linear discriminant analysis
> huile.lda <- lda(variety ~ ., data = huile)
Message d'avis :
In lda.default(x, grouping, ...) : les variables sont collinéaires
> #prediction on the training set
> pred.lda <- predict(huile.lda,newdata=huile)
> #confusion matrix
> mc.lda <- table(huile$variety,pred.lda$class)
> #error rate
> print(1-sum(diag(mc.lda))/sum(mc.lda))
[1] 0.3968254
> #variable selection
> huile.forward <- greedy.wilks(variety ~ ., data = huile, niveau = 0.05)
Erreur dans summary.manova(e2, test = "Wilks") : residuals have rank 32 < 33 |
J'ai pas compris que signifie cet erreur, j'espère que vous pouvez m'aider.
Merci d'avance.