IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Projet R à faire


Sujet :

R

  1. #1
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2013
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2013
    Messages : 9
    Points : 1
    Points
    1
    Par défaut Projet R à faire
    Bonjour,

    J'ai un projet sur le language R à faire et je ne sais pas du tout comment m'y prendre, par où commencer...
    J'ai seulement téléchargé le logiciel tinn-R ...

    Le premier exercice commence par ça :
    "Ecrire une fonction qui enregistre le code génétique contenu dans le fichier séquence.txt dans un vecteur. Chaque élément du vecteur contiendra une baze azotée de la séquence. Une fois la séquence enregistrée, le programme devra calculer le taux de A, U, C, G dans ce code génétique et le présenter sous la forme d'un histogramme."

    J'ai essayer "d'insérer" le code génétique en txt dans R mais ça ne fonctionne pas puisque le fichier est seulement sur mon ordi...
    Pouvez-vous m'éclairer ?

    Merci d'avance.

  2. #2
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Je vous conseille de commencer par jeter un oeil (et effectuer des tests avec R bien sûr !) à divers tutoriaux ou ouvrages (si vous en avez à disposition) sur R
    Vous en trouverez probablement sur internet mais sinon il y en a pas mal répertoriés ici : http://r.developpez.com/.
    Vous n'avez pas eu de cours de R sinon ?

    Ensuite, pour vous aider à démarrer, pour ce qui est du chargement des données dans R, voir par exemple la fonction read.table.
    Vous pouvez accéder à l'aide de cette fonction par :
    N'hésitez pas ensuite à revenir poser vos questions de manière plus précise et à nous présenter votre code (même faux ou incomplet) sur le forum !

    Bonne continuation


    Cordialement,

    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  3. #3
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 016
    Points : 23 705
    Points
    23 705
    Par défaut
    Bonjour,

    En complément, jetez peut-être aussi un œil sur le projet suivant : http://www.bioconductor.org/. Cela peut vous donner des pistes.
    Comme outil d'interface vers R, je vous conseille également RStudio, plus simple à mettre en œuvre et plus complet que Tinn-R (à mon goût du moins).

    Bon courage et n'hésitez pas à revenir vers le forum pour préciser les problèmes que vous rencontrez.
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  4. #4
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2013
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2013
    Messages : 9
    Points : 1
    Points
    1
    Par défaut
    Merci à vous,
    J'ai déjà fait pas mal d'exercices avec R en cours mais c'étaient de simples calculs, puis on était sur linux avec une console différente. Maintenant que je suis chez moi avec d'autres logiciels, je ne m'y retrouve plus ...
    Je vais regarder vos liens (merci) et télécharger Rstudio si il est mieux.
    Mais je ne comprends pas comment utiliser le fonction read sans avoir enregistré au préalable ma séquence.txt sur le logiciel ...
    Nous n'avons jamais vu ça en cours, puisqu'il s'agissait seulement de résoudre des algorithmes sans histogramme et fichier texte ...
    En tout cas, merci, je vais me repencher dessus

  5. #5
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 016
    Points : 23 705
    Points
    23 705
    Par défaut
    Si vous nous fournissez un extrait des premières lignes du fichier .txt, on peut vous aider à utiliser la fonction read.table de manière correcte.
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  6. #6
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2013
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2013
    Messages : 9
    Points : 1
    Points
    1
    Par défaut
    J'ai réussi à faire ça :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    > getwd()
    [1] "C:/Users/Sarah/Documents"
    > read.table("sequence.txt")
       V1 V2 V3 V4 V5 V6 V7 V8 V9 V10
    1   A  C  C  U  G  U  C  A  A   A
    2   C  A  A  A  U  C  U  G  G   U
    3   C  A  A  C  C  U  G  U  G   U
    4   C  C  A  A  U  U  C  A  G   G
    5   U  C  U  G  A  A  C  C  U   C
    6   A  A  A  C  C  G  U  G  U   A
    7   C  A  G  U  A  G  C  A  U   C
    8   A  C  A  U  G  G  U  G  A   A
    9   C  C  U  U  G  U  C  A  C   A
    10  U  G  C  A  C  A  U  C  A   A
    11  U  A  A  C  G  G  U  A  C   U
    12  A  G  G  U  C  U  A  A  U   G
    > seq<-scan(file="sequence.txt",what="character")
    Read 120 items
    > seq
      [1] "A" "C" "C" "U" "G" "U" "C" "A" "A" "A" "C" "A" "A" "A"
     [15] "U" "C" "U" "G" "G" "U" "C" "A" "A" "C" "C" "U" "G" "U"
     [29] "G" "U" "C" "C" "A" "A" "U" "U" "C" "A" "G" "G" "U" "C"
     [43] "U" "G" "A" "A" "C" "C" "U" "C" "A" "A" "A" "C" "C" "G"
     [57] "U" "G" "U" "A" "C" "A" "G" "U" "A" "G" "C" "A" "U" "C"
     [71] "A" "C" "A" "U" "G" "G" "U" "G" "A" "A" "C" "C" "U" "U"
     [85] "G" "U" "C" "A" "C" "A" "U" "G" "C" "A" "C" "A" "U" "C"
     [99] "A" "A" "U" "A" "A" "C" "G" "G" "U" "A" "C" "U" "A" "G"
    [113] "G" "U" "C" "U" "A" "A" "U" "G"
    La séquence est bien enregistrée là ?

  7. #7
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 016
    Points : 23 705
    Points
    23 705
    Par défaut
    Avec la fonction scan, oui : vous obtenez bien un vecteur de 120 éléments (un par base).
    Ça semble donc correct.
    Ne reste plus qu'à sortir le nombre de chacune des bases et l'histogramme.
    Besoin d'aide pour ça ?
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  8. #8
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2013
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2013
    Messages : 9
    Points : 1
    Points
    1
    Par défaut
    Oui j'aimerais bien parce que j'ai essayé avec la fréquence de cette manière mais ça ne fonctionne pas : (nous avions vu ça en cours mais avec des vecteurs)

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    freq<-seq("A")
    i<-1
    while(i<=length(seq))
    {
    freq[seq[i]]<-freq[seq[i]]+1
    i<i+1
    }
    i<-1
    while(i<=length(freq))
    {
    freq[i]<-freq[i]/length(seq)
    print(paste("la fréquence de",i,"est de",freq[i])
    i<i+1
    }

  9. #9
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 016
    Points : 23 705
    Points
    23 705
    Par défaut
    Il y a bien plus simple :
    Ne cherchez pas à faire de jolis affichages de résultats avec R (du genre "la fréquence de ... est ...). Ce n'est pas fait pour ça.
    Essayez déjà d'obtenir l'information "brute". Et pour ça, table(seq) suffit .
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  10. #10
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2013
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2013
    Messages : 9
    Points : 1
    Points
    1
    Par défaut
    d'accord et c'est quoi que je dois remplacer par table seq ?

  11. #11
    Membre habitué
    Inscrit en
    Mars 2009
    Messages
    94
    Détails du profil
    Informations forums :
    Inscription : Mars 2009
    Messages : 94
    Points : 147
    Points
    147
    Par défaut
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    seq<-scan(file="sequence.txt",what="character")
    t = table(seq)
    barplot(t)

  12. #12
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2013
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2013
    Messages : 9
    Points : 1
    Points
    1
    Par défaut
    Merci beaucoup

    Pour la suite il y a ça :

    Ecrire une fonction qui prend en paramètre une séquence de bases azotées, et qui retourne :
    • La position de cette séquence dans le code génétique, la fonction renverra un vecteur avec l’ensemble des positions de départ.
    • -1 si la séquence n’est pas présente

    Je dois bien utiliser la fonction while ?

  13. #13
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2013
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2013
    Messages : 9
    Points : 1
    Points
    1
    Par défaut
    j'ai trouver la fonction which et %in% qui permettent de retrouver dans un vecteur si j'ai bien compris. c'est peut être ça que je dois utiliser ....

  14. #14
    ced
    ced est déconnecté
    Rédacteur/Modérateur

    Avatar de ced
    Homme Profil pro
    Gestion de bases de données techniques
    Inscrit en
    Avril 2002
    Messages
    6 016
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Loiret (Centre)

    Informations professionnelles :
    Activité : Gestion de bases de données techniques
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Avril 2002
    Messages : 6 016
    Points : 23 705
    Points
    23 705
    Par défaut
    Ça semble être une bonne piste
    Rédacteur / Modérateur SGBD et R
    Mes tutoriels et la FAQ MySQL

    ----------------------------------------------------
    Pensez aux balises code et au tag
    Une réponse vous a plu ? N'hésitez pas à y mettre un
    Je ne réponds pas aux questions techniques par message privé, les forums sont là pour ça

  15. #15
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2013
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2013
    Messages : 9
    Points : 1
    Points
    1
    Par défaut
    Je vais tenter d'expliquer mon raisonnement dans un document à côté parce que je n'arrive pas à le mettre en forme...
    J'ai tenté des choses de la sorte en sachant que ça n'allait pas fonctionner de toute manière
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    which(seq="A","U","C","G")

  16. #16
    Membre habitué
    Inscrit en
    Mars 2009
    Messages
    94
    Détails du profil
    Informations forums :
    Inscription : Mars 2009
    Messages : 94
    Points : 147
    Points
    147
    Par défaut
    Je n'ai pas compris le problème en question, un exemple serait bienvenu.

  17. #17
    Futur Membre du Club
    Inscrit en
    Mai 2007
    Messages
    4
    Détails du profil
    Informations forums :
    Inscription : Mai 2007
    Messages : 4
    Points : 7
    Points
    7
    Par défaut
    Salut
    il me semble que le domaine de biométrie a ses propres packages qui peuvent traiter la suite des caractère CGAT.. comme des séquences et non pas comme des suites de caractères ... mais je ne suis pas spécialiste.


    Je propose de regarder un peu ici http://pbil.univ-lyon1.fr/R_svn/pdf/tdr16.pdf il y du traitement de génome bactérien si ça peut aider.

  18. #18
    Nouveau Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2013
    Messages
    9
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Janvier 2013
    Messages : 9
    Points : 1
    Points
    1
    Par défaut
    Merci beaucoup

Discussions similaires

  1. Projet BTS : Faire du graphique simplement ?
    Par nico77580 dans le forum Langages de programmation
    Réponses: 4
    Dernier message: 29/03/2010, 23h50
  2. [VB.NET]Projet a faire ?
    Par bmhummer dans le forum VB.NET
    Réponses: 1
    Dernier message: 08/04/2007, 21h12
  3. Réponses: 9
    Dernier message: 07/11/2005, 19h57

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo