Bonjour,

Dans le cadre d'une étude statistique sur un jeu de données, sous R, où par exemple, j'ai une variable qualitative qui est du texte, je souhaite relever des mots spécifiques, afin de créer une nouvelle variable où je n'aurais que des modalités.
Par exemple :

J'ai testament de M.X
je ne veux prendre que testament

Alors, j'ai essayé plusieurs solutions :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
 
levels(histo$Analyse)[grep("Testament",levels(histo$Analyse))] <- "Testament"
Pour celle-ci, je n'ai rien qui a bougé, pas d'erreur.

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
 
histo$mo<-ifelse(table(grep("Testament",histo$Analyse))==1, "Testament",
                            ifelse(table(grep("Inventaire",histo$Analyse))==1, "Inventaire",
                                           ifelse(table(grep("Accord",histo$Analyse))==1, "Accord",
                                                                ifelse(table(grep("Alliance",histo$Analyse))==1, "Alliance","Pas d'éléments"))),
levels = c("Pas d'éléments","Alliance","Accord","Inventaire","Testament"))
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
Error in `$<-.data.frame`(`*tmp*`, "mo", value = c("Testament", "Testament",  : 
  le tableau de remplacement a 78 lignes, le tableau remplacé en a 3355
Je comprends l'erreur, mais je ne vois pas comment je peux la rectifier.

Je vous remercie d'avance de votre aide.

Cordialement.