[R] extraction d'une chaîne de caractères dans un champ
Bonjour,
J'ai déjà parcouru beaucoup de posts depuis ce matin et j'ai besoin d'aide car je me noie dans les différentes librairies et possibilités.
J'ai deux colonnes: une avec mon identifiant, l'autre avec une description (texte)
Dans cette description, je voudrais extraire et mettre dans une nouvelle colonne tous les mots qui commencent par "ND_" et les 5 caractères qui suivent
Par exemple, pour l'id 50, j'ai une description avec ND_12345 et ND_65879: je voudrais dans un premier extraire ces "mots", et ensuite créer un tableau (divisier la cellule en colonne (pas en ligne)
Etat initial
id Description
5 xxxxxxxxxxxxxxxxxxxxxxxxx ND_00133 xxxxxxxx (ND_02018) xxxx
Extraction
id Description extraction
5 xxxxxxxxxxxxxxxxxxxxxxxxx ND_00133 xxxxxxxx (ND_02018) xxxx ND_00133
5 ND_02018
Transposition
id transposition
5 ND_00133
5 ND_02018
Je suppose que c'est simple mais je suis en train de me noyer
J'ai testé des choses mais franchement je ne préfère même pas vous montrer (récup des 5 chiffres, conversion de liste en caractères, mais je n'arrive à supprimer les caractères qui ne m'intéressent pas, type ", (,))
Je pourrai tout faire sur Excel mais je vais très probablement devoir reproduire plusieurs fois cette manip
Pouvez-vous m'aider svp?
Je voudrai trouver un moyen logique et simple pour y arriver
Merci beaucoup!