Extraire des mots d'une variable quali (texte)
Bonjour,
Dans le cadre d'une étude statistique sur un jeu de données, sous R, où par exemple, j'ai une variable qualitative qui est du texte, je souhaite relever des mots spécifiques, afin de créer une nouvelle variable où je n'aurais que des modalités.
Par exemple :
J'ai testament de M.X
je ne veux prendre que testament
Alors, j'ai essayé plusieurs solutions :
Code:
1 2
|
levels(histo$Analyse)[grep("Testament",levels(histo$Analyse))] <- "Testament" |
Pour celle-ci, je n'ai rien qui a bougé, pas d'erreur.
Code:
1 2 3 4 5 6
|
histo$mo<-ifelse(table(grep("Testament",histo$Analyse))==1, "Testament",
ifelse(table(grep("Inventaire",histo$Analyse))==1, "Inventaire",
ifelse(table(grep("Accord",histo$Analyse))==1, "Accord",
ifelse(table(grep("Alliance",histo$Analyse))==1, "Alliance","Pas d'éléments"))),
levels = c("Pas d'éléments","Alliance","Accord","Inventaire","Testament")) |
Code:
1 2
| Error in `$<-.data.frame`(`*tmp*`, "mo", value = c("Testament", "Testament", :
le tableau de remplacement a 78 lignes, le tableau remplacé en a 3355 |
Je comprends l'erreur, mais je ne vois pas comment je peux la rectifier.
Je vous remercie d'avance de votre aide.
Cordialement.