Bonjour, je suis actuellement en licence STS et on me demande de mettre en place un projet de R. L’objectif de ce projet est d’analyser quelques propriétés du code génétique à partir d'une séquence de bases azotées. La séquence étant :
Le travail sur ça étant : Fréquence d’apparition des 4 bases azotées
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12 A C C U G U C A A A C A A A U C U G G U C A A C C U G U G U C C A A U U C A G G U C U G A A C C U C A A A C C G U G U A C A G U A G C A U C A C A U G G U G A A C C U U G U C A C A U G C A C A U C A A U A A C G G U A C U A G G U C U A A U G
Ecrire une fonction qui enregistre le code génétique contenu dans le fichier sequence.txt dans un vecteur. Chaque élément du vecteur contiendra une base azotée de la séquence. Une fois la séquence enregistrée, le programme devra calculer le taux de A, U, C et G dans ce code génétique et le présenter sous la forme d’un histogramme.
Et :
Recherche d’une séquence
Il peut être intéressant pour une personne de savoir si une séquence de bases azotées est présente dans le code génétique proposé.
Ecrire une fonction qui prend en paramètre une séquence de bases azotées, et qui retourne :
La position de cette séquence dans le code génétique si cette séquence est dans le code génétique. Dans le cas où cette séquence est présente à plusieurs endroits dans le code génétique, la fonction renverra un vecteur avec l’ensemble des positions de départ.
-1 si la séquence n’est pas présente dans le code.
Actuellement et pour être franc, je suis complément pommé, je ne comprends rien aux algorithmes, j'ai beau me creuser la cervelle, lire des bouquins, chercher sur le net, ça vient pas ...
Si vous avez un petit peu de temps à accorder à un étudiant vraiment nul en informatique, ça serait très sympa.
Merci de votre lecture.
Partager