IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Analyse table de données


Sujet :

R

  1. #1
    Nouveau Candidat au Club
    Inscrit en
    Juin 2009
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Juin 2009
    Messages : 7
    Points : 1
    Points
    1
    Par défaut Analyse table de données
    Bonjour,

    Mes deux colocataires et moi même sommes étudiant en iut génie biologique. Au moment de choisir un projet tutoré il n'en resté plus qu'un : "analyser une table de donnée en rapport avec la biologie ou l'agroalimentaire à partir du logiciel R".

    ....Nous voila complètement perdu : on a réussi à trouver une base de donner qui nous semble correcte, cependant on sait absolument pas quoi en faire. On à vus les bases en cours de ce logiciel mais c'était il y a un petit moment et on a du mal à ce lancer sans les directives de notre professeur.

    Pourriez vous nous donnez quelques directions à prendre dans notre analyse ?

    voici la table : http://stats.unipune.ernet.in/Databo...sPUNE/Lung.xls

    pour la description : http://stats.unipune.ernet.in/Databo...ption/Lung.doc


    Voila, si ce qui est demandez vous semble aberrant je m'en excuse d'avance !

    Edit : quelques fautes enlevés, je demanderais la correction d'un de mes colocataires bien meilleurs que moi en orthographe

  2. #2
    Membre habitué
    Inscrit en
    Juin 2007
    Messages
    259
    Détails du profil
    Informations forums :
    Inscription : Juin 2007
    Messages : 259
    Points : 177
    Points
    177
    Par défaut
    Citation Envoyé par Lokhtar Voir le message
    Nous voila complètement perdue : on a réussi à trouver une base de donner qui nous semble correcte, cependant on sait absolument pas quoi en faire. On à vus les bases en cours de ce logiciel mais c'était il y a un petit momant et on a du mal à ce lancer sans les directives de notre professeur.
    Ces données ce sont celles que vous donnez en lien ci dessous ? (doc et xls)
    Ou bien ces fichiers vous ont été fournis par votre prof ?
    En tout cas, cela me semble tout à fait correct comme type de données pour réaliser votre étude.
    Avez vous au moins bien compris l'origine et la signification de ces données ?

    Citation Envoyé par Lokhtar Voir le message
    Pourriez vous nous donnez quelques direction à prendre dans notre analyse ?
    Je suis tout aussi novice en R mais à partir de ces données on devrait pouvoir faire 2 ou 3 analyses sympas, du genre :
    - pour chaque localité, y a-t-il un effet du traitement ? il faudrait faire l'analyse pour la localité 1 puis pour la localité 2 et voir si le traitement est efficace plus pour l'une que pour l'autre.
    - refaire l'analyse sans tenir compte de la localité, simplement pour tester l'efficacité globale du traitement
    - y a-t-il une corrélation entre le smoking index (le fait de fumer beaucoup) et la capacité pulmonaire avant traitement.
    - idem mais après traitement : récupère-t-on mieux de sa capacité pulmonaire après traitement si l'on était peu fumeur auparavant

    Je ne sais pas si ce sont les bonnes questions, mais ça tombe bien j'ai un exam de biostats dans 1 mois, ça va me permettre de réviser aussi...

    PS: gaffe aux fautes d'orthographes !

  3. #3
    Nouveau Candidat au Club
    Inscrit en
    Juin 2009
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Juin 2009
    Messages : 7
    Points : 1
    Points
    1
    Par défaut
    C'est une table que nous avons trouvé et en effet elle semble bien répondre aux critères demandés par le prof après avoir discuter avec lui (variables qualitatives et quantitatives, table pas trop longue mais pas trop courte non plus...). Bien que la variable qualitatives Male et Femelle soit pas terrible. On nous a demandé de croiser les variables afin d'en faire resortir l'essentiel.

    On avait à peut pret eu les mêmes idées mais le problèmes est qu'on a du mal à se souvenir des comandes (honte à nous). Je m'y remet cet après-midi et je dirais ce que j'ai réussi à en sortir.


    PS : Pardonner mes fautes, j'ai beau me relire...

  4. #4
    Membre expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Points : 3 378
    Points
    3 378
    Par défaut
    Bonjour,
    Citation Envoyé par Lokhtar Voir le message
    On avait à peut pret eu les mêmes idées mais le problèmes est qu'on a du mal à se souvenir des comandes (honte à nous).
    Bah, comme tout le monde dans un premier temps !
    R reference card
    Forum LaTeX : pour des réponses rapides et appropriées, pensez à poster un
    ECM = Exemple (reproduit le problème) Complet (document compilable) Minimal (ne postez pas votre thèse !)

    Une solution vous convient ? N'oubliez pas le tag


    )><))))°>

  5. #5
    Nouveau membre du Club
    Homme Profil pro
    Développeur Web
    Inscrit en
    Mai 2009
    Messages
    22
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Bouches du Rhône (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Développeur Web

    Informations forums :
    Inscription : Mai 2009
    Messages : 22
    Points : 28
    Points
    28
    Par défaut
    Pour charger un document :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    ?read.table
    ?read.csv
    Pour effectuer une anova(comparaison de moyennes entre plusieurs groupes) :
    Pour les tests de normalité et d'homoscédasticité
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    ?shapiro.test
    ?bartlett.test
    Deux nombreux manuels sont disponibles sur le net concernant l'anova,et d'ailleurs il existe un jeu test sur le cancer du poumon dans R.

  6. #6
    Nouveau Candidat au Club
    Inscrit en
    Juin 2009
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Juin 2009
    Messages : 7
    Points : 1
    Points
    1
    Par défaut
    Merci pour ta réponse balap, mais notre devoir porte plutot (d'apres ce qui a été travaillé en cours) sur des comandes de type "plot", "cloud", "pie"... pour les graphiques

    Après on a vus les comandes de bases : summary, mean ...

    Et enfin il serait bon de faire au moins un test de ki² (sa ferait plaisir au correcteur ^^).

    Je suis en train de batailler à écrire mais j'ai vraimant du mal à écrire c'est très frustrant, j'arrive pas a écrire une comande qui tienne la route.

    Jvais essayer de ce pas ta comande anova

    EDIT :

    Bon après avoir essayé pendant j'ai un souci récurent je n'arrive à rien faire, pour toute mes comandes il me renvoi le meme message d'erreur pourant je comprend pas, j'ai bien des chiffres dans la colonne 4 (puisque la premiere ligne n'est aps lut grace au header=true)...

    >x=read.table('C:/Documents and Settings/Administrateur/Mes documents/projet tutore/Lung.ods',header=TRUE,sep=';',row.names=1)
    >mean(x[,4])
    [1] NA
    Warning message:
    In mean.default(x[, 4]) :
    l'argument n'est ni numérique, ni logique : renvoi de NA

  7. #7
    Nouveau Candidat au Club
    Inscrit en
    Juin 2009
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Juin 2009
    Messages : 7
    Points : 1
    Points
    1
    Par défaut
    Quand je tape une demande de colonne il me donne ca :

    x[,2]
    x[,2]
    [1] 1,01 0,88 0,79 0,67 0,77 1,24 0,75 0,98 0,67 1,55 1,00 0,65 2,30 1,60 0,80 1,21 1,28 1,43 0,98 1,49 0,65 0,94 0,86 1,35
    [25] 0,75 1,30 1,22 1,34 1,23 0,92 0,85 0,83 0,49 1,22 1,24 0,89 0,69 0,79 0,89 1,22 0,56
    32 Levels: 0,49 0,56 0,65 0,67 0,69 0,75 0,77 0,79 0,80 0,83 0,85 0,86 0,88 0,89 0,92 0,94 0,98 1,00 1,01 1,21 ... 2,30
    Plusieurs choses me font bizarre : le "32 Levels" et les "...", ca doit être à cause de l'un ou l'autre qu'il me dit que mes arguments ne sont aps numérique mais j'arrive pas à changer ca.

    Désolé pour le double post

  8. #8
    Membre expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Points : 3 378
    Points
    3 378
    Par défaut
    Bonsoir,

    C'est parce que le séparateur décimal de R est le "."
    Tu devrais très simplement régler ça en ajoutant un argument à ton read.table
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    x <- read.table('C:/Documents and Settings/Administrateur/Mes documents/projet tutore/Lung.ods', 
                    header=TRUE, sep=';', row.names=1, dec=".")
    ou peut-être plus simplement encore en utilisant read.cvs2()

    Deux/trois petites remarques pour améliorer la lisibilité du code
    • préférer "<-" à "=" pour les assignations
    • ne pas hésiter à mettre des espaces et des sauts à la ligne dans une même commande pour aérer
    • en fait ça faisait que deux remarques !
    Forum LaTeX : pour des réponses rapides et appropriées, pensez à poster un
    ECM = Exemple (reproduit le problème) Complet (document compilable) Minimal (ne postez pas votre thèse !)

    Une solution vous convient ? N'oubliez pas le tag


    )><))))°>

  9. #9
    Nouveau Candidat au Club
    Inscrit en
    Juin 2009
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Juin 2009
    Messages : 7
    Points : 1
    Points
    1
    Par défaut
    Excusez moi, je me rend compte que mes commandes doivent être désagréable a lire pour des habitués^^

    Bon sinon cette explication semblait tenir la route malheureusement ca n'a rien changé


    étrangement la fonction "mean" marche pour l'age et pour la Localité (ce qui est totalement inutile pour ce dernier)

  10. #10
    Membre expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Points : 3 378
    Points
    3 378
    Par défaut
    Citation Envoyé par Lokhtar Voir le message
    Bon sinon cette explication semblait tenir la route malheureusement ca n'a rien changé
    J'imagine qu'il s'agit du fichier excel exporté en texte (je suis un peu étonné de l'extension .ods, mais la fonction arrive à récupérer des données... alors ça doit être ça).
    Vérifie dans le fichier que la colonne en question a bien été exportée en numérique (sans "). Sinon, le problème vient peut-être du format de cellule (nombres > texte).
    Forum LaTeX : pour des réponses rapides et appropriées, pensez à poster un
    ECM = Exemple (reproduit le problème) Complet (document compilable) Minimal (ne postez pas votre thèse !)

    Une solution vous convient ? N'oubliez pas le tag


    )><))))°>

  11. #11
    Nouveau Candidat au Club
    Inscrit en
    Juin 2009
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Juin 2009
    Messages : 7
    Points : 1
    Points
    1
    Par défaut
    Enfait ta première réponse était quasiment la bonne !

    Il fallait écrire :

    dec=","
    et pas

    dec="."
    puisque comme dit précédement c'est le moyen de séparateur par défaut de R ^^

    c'est toujours ce genre d'erreur qui sont pénible :p

  12. #12
    Membre expert
    Avatar de pitipoisson
    Homme Profil pro
    Chercheur
    Inscrit en
    Septembre 2006
    Messages
    1 942
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Finistère (Bretagne)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Septembre 2006
    Messages : 1 942
    Points : 3 378
    Points
    3 378
    Par défaut
    Rhôôoo, comment j'ai pû envoyer une annerie comme ça
    Je les cumule en ce moment.

    Mea culpa
    Forum LaTeX : pour des réponses rapides et appropriées, pensez à poster un
    ECM = Exemple (reproduit le problème) Complet (document compilable) Minimal (ne postez pas votre thèse !)

    Une solution vous convient ? N'oubliez pas le tag


    )><))))°>

  13. #13
    Nouveau Candidat au Club
    Inscrit en
    Juin 2009
    Messages
    7
    Détails du profil
    Informations forums :
    Inscription : Juin 2009
    Messages : 7
    Points : 1
    Points
    1
    Par défaut
    Bon, après un petit moment de silence, à nouveau nous avons un problème :

    On arrive pas à faire un barplot de la variation de LCI en fonction de la localité


    LCIvariation=as.data.frame(as.matrix(x[,3]-x[,2]))

    names(LCIvariation)='LCIvariation'

    a=cbind(x,LCIvariation) jusque la tout va bien j'ai rajouter la colonne

    > barplot(a[,2]~a[,8])

    Erreur dans barplot.default(a[, 8] ~ a[, 2]) là c'est le drame^^
    'height' doit être un vecteur ou une matrice

Discussions similaires

  1. Tables avec données temporelles
    Par blins dans le forum Oracle
    Réponses: 12
    Dernier message: 12/12/2005, 09h50
  2. Performances : ANALYSE TABLE, quelle fréquence ?
    Par Mr N. dans le forum SQL Procédural
    Réponses: 4
    Dernier message: 26/10/2005, 17h02
  3. Réponses: 3
    Dernier message: 21/10/2005, 14h56
  4. Réponses: 9
    Dernier message: 07/10/2004, 19h41
  5. [QuickReport] Données d'une table et données calculées
    Par poufouille dans le forum Bases de données
    Réponses: 11
    Dernier message: 30/03/2004, 16h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo