Bonjour,
J'ai un problème d'accès à mes données : je lis un fichier csv et je m'intéresse à 2 variables en particulier (codon.wild et codon.mut).
Il s'agit d'un problème de biologie. J'ai ici les codons "sauvages" et les codons mutés. J'ai besoin d'utiliser un logiciel qui prend en entrée un nucléotide sauvage et le nucléotide transformé correspondant. Ce qui donnerait :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9 > head(donnees) position chrom codon.wild codon.mut 1 6589165 chr1 GCT TCT 2 12854480 chr1 CGC CAC 3 36915872 chr1 GAC GAA 4 42628591 chr1 TGT AGT 5 48825430 chr1 CCC ACC 6 62921096 chr1 ATG GTG
Je cherche donc où est la différence dans mon triplet (sachant qu'on compare seulement 1-1, 2-2 et 3-3).
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 position chrom nucleo.wild nucleo.mut 1 6589165 chr1 G T 2 12854480 chr1 G A 3 36915872 chr1 C A ...
Mon problème est que je n'arrive pas récupérer les 3 lettres indépendament.
J'ai l'impression que mon problème est que chaque triplet est considéré comme un character. Je ne peux donc pas séparer les lettres.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10 temp_wild=as.character(donnees[,3]) > temp_wild[1] [1] "GCT" > temp_wild[1,1] Erreur dans temp_wild[1, 1] : nombre de dimensions incorrect > temp_wild[[1]] [1] "GCT" str(temp_wild) chr [1:179] "GCT" "CGC" "GAC" "TGT" "CCC" "ATG" "GTA" ...
Je ne vois pas comment convertir alors ma liste ...
De plus, savez-vous s'il existe une fonction pour faire ce genre de comparaison directement ?
Merci d'avance
Partager