Bonjour à tous,

Nouveau dans le R, je suis en train d'apprendre à jouer avec,

Je suis face à une difficulté que je n'arrive pas à résoudre, et je fais appel à vous pour un coup de pouce

Je voudrais créer une nouvelle colonne " nouveau " dans un fichier xlsx, appelé " premier doc " et vérifier si dans un autre fichier, appelé " deuxième doc ", on retrouve la même donnée parmi toutes les lignes.

Exemple :

Dans Premierdoc.xlsx

monde économique
personne jean bernard
auteur fred olivier


Dans deuxiemedoc.xlsx

culturel société
personne jean riri
auteur fred hervé


Je voudrais donc créer une colonne nouveau dans premierdoc et mettre TRUE si, on retrouve Jean et Fred dans culturel


Mon code :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
pathxlsx <- le chemin de mon fichier 
siteconf <- le chemin de mon deuxième fichier
 
#Premier step :
 
urls <-  read_excel(pathxlsx, 
                    sheet = 1, 
                    col_names = TRUE, 
                    na = "",
                    skip=1)
 
#Second step 
 
doc <-  read_excel(siteconf, 
                       sheet = 1,
)
 
doc <- as.character(doc[,1])
 
print(doc[j])
 
urls$nouveau <- TRUE
 
for (j in 1:length(schemas))
{
# print(schemas[j])
   urls$nouveaul[which(stri_detect_fixed(urls$monde,doc[j],case_insensitive=TRUE))] <- doc[j]
} 
 
 
urls$nouveau <- as.factor(urls$nouveau)
 
 
urls$nouveau<- as.factor(urls$nouveau)

Quelqu'un pour m'aider ?? ))

Merciii