Je cherche à subdiviser un data frame en plusieurs data frameq selon les modalités d'une variable y

**salmasise** · 24/11/2017, 21h38

Bonjour,
Dans le cadre d'un projet de création d'un package R pour l'analyse discriminante prédictive, je souhaite subdiviser mon data frame selon les modalités de la variable à prédire (y).

Voici à quoi ressemble mon code :

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
mat.var<- function(my_data) {
  ##Définir la variable y de type facteur
  for (i in 1 : ncol(my_data)) {
    if (class(my_data[,i]) == "factor" || class(my_data[,i]) == "character")  {
      y <- my_data[,i]
    }
  }
  ## Fin de la définition de la variable y
  #Subdivision selon les modalités de Y

  #Niveaux de y
  y.levels <- levels(y)
  for (i in 1 : length(y.levels)) {
   a <- subset(my_data, y == y.levels[i])
  } 
  print(a)
}

Ce qui se passe est que dans ma variable a, je retrouve que le dataframe de la dernière modalité, ce qui est normal vu que a est écrasée après chaque itération.
Ce que je souhaite avoir est assez de data frames que de nombres de modalités y.
Merci beaucoup pour vos propositions.
Salma

**Alpacky** · 27/11/2017, 11h16

bonjour,

vous pouvez faire une liste de dataframe

Code :

Sélectionner tout - Visualiser dans une fenêtre à part

1
2
3
4
5
6
 
a.list <- list()
...
# loop
...
a.list[[i]] <- a

sinon pour découper le dataframe en plusieurs dataframe selon des factors, la fonction split semble assez adaptée,

cdt

**tototode** · 27/11/2017, 11h56

Bonjour,

la fonction split permet de subdiviser un data.frame en fonction des modalités d'un facteur, et tous les sous tableaux sont stockés dans une liste.

Code :

Sélectionner tout - Visualiser dans une fenêtre à part