IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

test student avec un fichier qu'il faut couper


Sujet :

R

  1. #1
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2012
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Services à domicile

    Informations forums :
    Inscription : Janvier 2012
    Messages : 57
    Points : 36
    Points
    36
    Par défaut test student avec un fichier qu'il faut couper
    Bonjour,

    je veux faire un test de Student sur mes données qui sont organisées comme suit :
    Sequence -- A -- B
    seq1 -- 2.3 -- 3.2
    seq1 -- 1 -- 0.9
    seq1 -- 0.2 -- 0
    seq2 -- 5 -- 6
    seq2 -- 2.3 -- 2
    seq2 -- 3 -- 3.2
    ...

    Je veux faire le test de Student entre mes valeurs de A et B pour chaque séquence.

    Je le fais avec PERL et R integré, mais c'est très très long, car je divise mon long fichier en d'autres petits fichiers que je donne à R à chaque fois, pour avoir la p-value.

    Je lis mon long fichier de milliers de lignes et à chaque fois je mets les trois lignes d'une séquence et je passe ce fichier à R.

    Savez-vous comment faire avec R pour que je puisse faire tout d'un coup ?

    Merci d'avance

  2. #2
    Membre confirmé
    Homme Profil pro
    MCU
    Inscrit en
    Juillet 2010
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : MCU
    Secteur : Santé

    Informations forums :
    Inscription : Juillet 2010
    Messages : 185
    Points : 486
    Points
    486
    Par défaut
    Bonjour,

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    ?t.test
    example(t.test)
    HTH

    Vincent

  3. #3
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2012
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Services à domicile

    Informations forums :
    Inscription : Janvier 2012
    Messages : 57
    Points : 36
    Points
    36
    Par défaut
    Citation Envoyé par vchouraki Voir le message
    Bonjour,

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    ?t.test
    example(t.test)
    HTH

    Vincent

    Merci d'avoir répondu

    Mais non, la formule pour faire le test de Student je la connais.
    Mon problème est que je ne sais pas comment dire à R de me faire ce test pour chaque séquence dans mon tableau qui est représentée par trois lignes dans ce cas:
    exemple:


    Sequence|analyse_A|analyse_B
    seq1|2.3|3.2
    seq1|1|0.9
    seq1|0.2|0
    seq2|5|6
    seq2|2.3|2
    seq2|3|3.2
    Si je fais ça :
    t.test(data[,2], data[,3]), il va me faire le test pour toutes les séquences, alors ce que je veux, c'est calculer la p-value pour chaque séquence
    seq 1 => sa p-value
    seq 2 => sa p-value
    ainsi de suite

  4. #4
    Membre confirmé
    Homme Profil pro
    MCU
    Inscrit en
    Juillet 2010
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : MCU
    Secteur : Santé

    Informations forums :
    Inscription : Juillet 2010
    Messages : 185
    Points : 486
    Points
    486
    Par défaut
    Bonjour,

    Au temps pour moi. Une boucle for ou sapply devrait suffire. voir which pour sélectionner selon la valeur de la séquence et str pour aider à extraire la p.value.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    ?Control
    ?sapply
    ?which
    ?str
    Par exemple :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    test <- data.frame(a=1:100, b=100:1, c=rep(1:20, each=5))
    for (i in unique(test$c)) {
    pval <- t.test(test$a[which(test$c == i)], test$b[which(test$c == i)])$p.value
    print(paste("pour c = ", i, ", pval=", sprintf("%.2e", pval), sep=""))
    }
    ou

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sapply(unique(test$c), function(x)t.test(test$a[which(test$c == x)], test$b[which(test$c == x)])$p.value)
    HTH

    Vincent

  5. #5
    Nouveau membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Janvier 2012
    Messages
    57
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Services à domicile

    Informations forums :
    Inscription : Janvier 2012
    Messages : 57
    Points : 36
    Points
    36
    Par défaut
    Citation Envoyé par vchouraki Voir le message
    Bonjour,

    Au temps pour moi. Une boucle for ou sapply devrait suffire. voir which pour sélectionner selon la valeur de la séquence et str pour aider à extraire la p.value.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    ?Control
    ?sapply
    ?which
    ?str
    Par exemple :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    test <- data.frame(a=1:100, b=100:1, c=rep(1:20, each=5))
    for (i in unique(test$c)) {
    pval <- t.test(test$a[which(test$c == i)], test$b[which(test$c == i)])$p.value
    print(paste("pour c = ", i, ", pval=", sprintf("%.2e", pval), sep=""))
    }
    ou

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    sapply(unique(test$c), function(x)t.test(test$a[which(test$c == x)], test$b[which(test$c == x)])$p.value)
    HTH

    Vincent



    D'accord, je comprends.
    En fait mes données sont comme cela (avec d'autres colonnes, mais seulement ces colonnes qui m'intéressent).


    Sequence|charge|modification|analyse_A|analyse_B
    seq1|1|modif1|2.3|3.2
    seq1|1|modif1|1|0.9
    seq1|1|modif1|0.2|0
    seq2|1||5|6
    seq2|1||2.3|2
    seq2|1||3|3.2
    donc ma séquence est définie par : la séquence, la charge et la modification (dans la colonne modification il se peut qu'elle soit vide parfois)

    Donc en se basant sur ce que tu m'as expliqué au-dessus: j'ai essayé ça, mais il me dit qu'il y a une erreur.

    Voila ce que j'ai écrit:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    >data<-read.table("chemin vers mon fichier", sep = "\t", header = FALSE)
    > for (i in unique(data[,1], data[,2], data[,3])) {
    + pval <- t.test(data[,4][which(data[,1] == i) && (data[,2] == i) && (data[,3] == i)], (data[,5][which(data[,1] == i) && (data[,2] == i) && (data[,3] == i)]$p.value
    + print(paste("pour peptide = ", i, ", pval=",pval, sep=""))
    Ça me donne cette erreur:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    Error: unexpected symbol in:
    "pval <- t.test(data[,10][which(data[,1] == i) && (data[,2] == i) && (data[,3] == i)], (data[,11][which(data[,1] == i) && (data[,2] == i) && (data[,3] == i)]$p.value
    print"
    Je ne sais pas si c'est correct, ce que j'ai écrit pour la boucle for et le reste (pval)

  6. #6
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Je pense qu'il y a une erreur de syntaxe dans la commande que vous avez écrite.
    Pour rappel :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    data [ indices_de_lignes_a_selectionner , indices_de_colonnes_a_selectionner ]
    Bonne continuation


    Cordialement,

    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

Discussions similaires

  1. [1.x] Test fonctionnel avec uplaod de fichier
    Par nelk75 dans le forum Symfony
    Réponses: 1
    Dernier message: 09/02/2010, 22h39
  2. Réponses: 1
    Dernier message: 03/09/2008, 13h35
  3. lancer un test avec un fichier .bat
    Par marc olivier dans le forum API standards et tierces
    Réponses: 14
    Dernier message: 28/04/2006, 10h33
  4. probleme test presence d'un fichier(avec fso)
    Par pagez dans le forum Général JavaScript
    Réponses: 7
    Dernier message: 30/08/2005, 15h24
  5. Problème avec les fichiers .JPG
    Par cprogil dans le forum Langage
    Réponses: 5
    Dernier message: 10/06/2003, 15h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo