Bonjour,
Dans le cadre d'un projet de création d'un package R pour l'analyse discriminante prédictive, je souhaite subdiviser mon data frame selon les modalités de la variable à prédire (y).

Voici à quoi ressemble mon code :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
mat.var<- function(my_data) {
  ##Définir la variable y de type facteur
  for (i in 1 : ncol(my_data)) {
    if (class(my_data[,i]) == "factor" || class(my_data[,i]) == "character")  {
      y <- my_data[,i]
    }
  }
  ## Fin de la définition de la variable y
  #Subdivision selon les modalités de Y

  #Niveaux de y
  y.levels <- levels(y)
  for (i in 1 : length(y.levels)) {
   a <- subset(my_data, y == y.levels[i])
  } 
  print(a)
}
Ce qui se passe est que dans ma variable a, je retrouve que le dataframe de la dernière modalité, ce qui est normal vu que a est écrasée après chaque itération.
Ce que je souhaite avoir est assez de data frames que de nombres de modalités y.
Merci beaucoup pour vos propositions.
Salma