Bonjour à tous,
Nouveau dans le R, je suis en train d'apprendre à jouer avec,
Je suis face à une difficulté que je n'arrive pas à résoudre, et je fais appel à vous pour un coup de pouce
Je voudrais créer une nouvelle colonne " nouveau " dans un fichier xlsx, appelé " premier doc " et vérifier si dans un autre fichier, appelé " deuxième doc ", on retrouve la même donnée parmi toutes les lignes.
Exemple :
Dans Premierdoc.xlsx
monde économique
personne jean bernard
auteur fred olivier
Dans deuxiemedoc.xlsx
culturel société
personne jean riri
auteur fred hervé
Je voudrais donc créer une colonne nouveau dans premierdoc et mettre TRUE si, on retrouve Jean et Fred dans culturel
Mon code :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34 pathxlsx <- le chemin de mon fichier siteconf <- le chemin de mon deuxième fichier #Premier step : urls <- read_excel(pathxlsx, sheet = 1, col_names = TRUE, na = "", skip=1) #Second step doc <- read_excel(siteconf, sheet = 1, ) doc <- as.character(doc[,1]) print(doc[j]) urls$nouveau <- TRUE for (j in 1:length(schemas)) { # print(schemas[j]) urls$nouveaul[which(stri_detect_fixed(urls$monde,doc[j],case_insensitive=TRUE))] <- doc[j] } urls$nouveau <- as.factor(urls$nouveau) urls$nouveau<- as.factor(urls$nouveau)
Quelqu'un pour m'aider ?? ))
Merciii
Partager