Bonjour,

J'ai un problème d'accès à mes données : je lis un fichier csv et je m'intéresse à 2 variables en particulier (codon.wild et codon.mut).

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
 
> head(donnees)
  position chrom codon.wild codon.mut
1  6589165  chr1        GCT       TCT
2 12854480  chr1        CGC       CAC
3 36915872  chr1        GAC       GAA
4 42628591  chr1        TGT       AGT
5 48825430  chr1        CCC       ACC
6 62921096  chr1        ATG       GTG
Il s'agit d'un problème de biologie. J'ai ici les codons "sauvages" et les codons mutés. J'ai besoin d'utiliser un logiciel qui prend en entrée un nucléotide sauvage et le nucléotide transformé correspondant. Ce qui donnerait :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
 
  position chrom nucleo.wild nucleo.mut
1  6589165  chr1        G       T
2 12854480  chr1        G       A
3 36915872  chr1        C       A
...
Je cherche donc où est la différence dans mon triplet (sachant qu'on compare seulement 1-1, 2-2 et 3-3).
Mon problème est que je n'arrive pas récupérer les 3 lettres indépendament.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
 
temp_wild=as.character(donnees[,3])
> temp_wild[1]
[1] "GCT"
> temp_wild[1,1]
Erreur dans temp_wild[1, 1] : nombre de dimensions incorrect
> temp_wild[[1]]
[1] "GCT"
str(temp_wild)
 chr [1:179] "GCT" "CGC" "GAC" "TGT" "CCC" "ATG" "GTA" ...
J'ai l'impression que mon problème est que chaque triplet est considéré comme un character. Je ne peux donc pas séparer les lettres.
Je ne vois pas comment convertir alors ma liste ...

De plus, savez-vous s'il existe une fonction pour faire ce genre de comparaison directement ?

Merci d'avance