IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Création d'un histogramme


Sujet :

R

  1. #1
    Nouveau membre du Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2012
    Messages
    56
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Distribution

    Informations forums :
    Inscription : Juin 2012
    Messages : 56
    Points : 38
    Points
    38
    Par défaut Création d'un histogramme
    Bonjour,

    Je souhaiterais parser un fichier csv et dresser un histogramme sous R.

    Jusqu'à présent, j'avais écris ceci:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    setwd("C:/progs/")
    pourcent <- read.table("Homp.csv", sep = ";", header = TRUE, dec = ",")
    attach(pourcent)
    Les données s'organisent ainsi:
    A 14
    B 22
    C 33

    Pour un nom de données "A" en abscisse, je voudrais associer un nombre 14 en ordonnées et ainsi de suite..

    Comment dois je formatter mon fichier csv ?
    A;14
    B;22
    C;33
    ??
    Comment utiliser la fonction hist() pour obtenir un histogramme répondant à mes souhaits? (il faudrait que les A B et C s'affichent en abscisse, en verticale ça serait parfait!)

    Merci.

  2. #2
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Bonjour,

    Je ne suis pas sûr de comprendre toute ta demande. La question de l'histogramme avec A, B, C en abscisse pour le quel je ne suis pas sur de répondre correctement à ta demande.

    Mais, concernant ton "csv". Tu dois avoir un point virgule entre chaque valeur comme tu l'as noté. Un échappement en fin de ligne "\n". En générale invisible sous les éditeurs de textes. C'est normal que tu ne le voies pas.

    Concernant l'histogramme une bibliothèque très bien faite pour toute sorte de graphiques c'est ggplot2.

    Avec elle tu peux coder cela(voire ci-dessous). Qui peut ressembler un peu à ce que je comprends de ta demande :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    ggplot(data, aes(V2, fill = V1)) + geom_histogram()
    avec data tes données, V1 ta colonne 1 et V2 ta colonne 2.

    Cordialement.

  3. #3
    Nouveau membre du Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2012
    Messages
    56
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Distribution

    Informations forums :
    Inscription : Juin 2012
    Messages : 56
    Points : 38
    Points
    38
    Par défaut
    J'ai finalement écris ceci:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    setwd("C:/progs/")
    matrix <- read.table("Homp.csv", sep = ";", header = TRUE, dec = ",")
    attach(matrix)
    p <- matrix[,1]
    pourcentages <- matrix[,2]
    m <- mean(pourcentages)
    par(mar=c(7, 4, 4, 2) + 0.1)
    barplot(pourcentages, names.arg=p, space=FALSE, col = "black", border = "white", las=2, main = "test", ylab = "Y label")
    Problème:
    - Je voudrais afficher la moyenne "m" sur l'histogramme, sur une ligne et afficher sa valeur numérique précise, si c'est possible.

    merci

  4. #4
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Bonjour,

    Avec la fonction lines pour la ligne de moyenne et text ou mtext selon ou tu veux placer ton texte, tu devrais t'en sortir.

    Cordialement.

  5. #5
    Nouveau membre du Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2012
    Messages
    56
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Distribution

    Informations forums :
    Inscription : Juin 2012
    Messages : 56
    Points : 38
    Points
    38
    Par défaut
    Bonjour,

    Je n'ai pas encore réussi à utiliser correctement la fonction line.. il m'affiche bien la valeur, mais uniquement un petit carré à un endroit dans l'histogramme.

    Je rebondis sur un autre problème, je souhaiterais colorier les barres de l'histogramme différemment selon le type de données. J'ai écris ceci juste avant le barplot():

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    len <- length(matrix)
    for (i in 1:len) {
    if (matrix[i,1] == "XXXX") { col = "blue" }
    }
    En procédant ainsi, ça devrait fonctionner non ?

  6. #6
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Excuse-moi, j'ai fait une petite faute, c'est lines et non line.

    Concernant les couleurs tu dois dans ton barplot rajouter un vecteur des couleurs que tu veux tu utiliser. Une couleur par classe.

    Exemple si tu as deux classes.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    color <- c("red", "bleu")
    barplot(pourcentages, names.arg=p, space=FALSE, col = color, border = "white", las=2, main = "test", ylab = "Y label")

    Cordialement.

  7. #7
    Nouveau membre du Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2012
    Messages
    56
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Distribution

    Informations forums :
    Inscription : Juin 2012
    Messages : 56
    Points : 38
    Points
    38
    Par défaut
    Je viens de regarder le résultat, il alterne les couleurs une fois sur deux.

    Mais en fait, pour mon cas précis, je veux colorier uniquement certains noms dans la matrice d'une certaines couleurs, le reste d'une autre couleur.

    ou lui dire genre "les 5 premières barre de l'histogramme en vert (matrix[1,1] - matrix[4,1], les autres en rouge".

  8. #8
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Bonjour,

    Je pense que tu m'as mal compris ou j'ai du mal m'exprimer.

    Par barre tu notes une couleur dans ton vecteur.

    exemples :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    color<-c(rep("green",5), rep("red", length(matrix[,1])-5))
    barplot(pourcentages, names.arg=p, space=FALSE, col = color, border = "white", las=2, main = "test", ylab = "Y label")
    rep répéte un terme n fois.

    Je ne suis pas sur que le code corresponde tout à fait à tes données. Mais l'idée est là.

    Cordialement.

  9. #9
    Nouveau membre du Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2012
    Messages
    56
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Distribution

    Informations forums :
    Inscription : Juin 2012
    Messages : 56
    Points : 38
    Points
    38
    Par défaut
    Bonjour,

    C'est tout a fait ce que je recherchais, il me manque juste un dernier point à résoudre et ça sera parfait.

    Je cherche à afficher précisemment les graduations sur l'axe des ordonnées, pour une meilleur lecture des valeurs obtenues.

    Quand on décide de définir un ylim=c(0,50) sur le barplot, je voudrais que des graduations apparaissent entre 0 - 10 - 20 etc.. Car ce n'est pas assez précis.

    Merci.

  10. #10
    Modératrice

    Femme Profil pro
    Statisticienne, Fondatrice de la société DACTA
    Inscrit en
    Juin 2010
    Messages
    893
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 35
    Localisation : France, Loire Atlantique (Pays de la Loire)

    Informations professionnelles :
    Activité : Statisticienne, Fondatrice de la société DACTA

    Informations forums :
    Inscription : Juin 2010
    Messages : 893
    Points : 2 673
    Points
    2 673
    Par défaut
    Bonjour,

    Voir du côté du paramètre graphique yaxp.

    Exemple :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    barplot(data,ylim=c(0,140),yaxp=c(0,140,14))

    Bonne continuation


    Cordialement,


    A.D.

    Forum R
    Fournir le code utilisé (pensez aux balises code !), les packages nécessaires, ainsi qu'un court mais représentatif extrait du jeu de données et les éventuels messages d'erreur.
    Recherche d'informations concernant R : RSiteSearch / tutoriels : http://r.developpez.com/cours/ .

    Pensez également au bouton "Résolu" et à voter (en bas à droite des messages) lorsque vous avez obtenu une réponse satisfaisante.

  11. #11
    Nouveau membre du Club
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Juin 2012
    Messages
    56
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Distribution

    Informations forums :
    Inscription : Juin 2012
    Messages : 56
    Points : 38
    Points
    38
    Par défaut
    Bonjour et merci de vos réponses.

    Je rebondis sur une autre interrogation, peut-on dire à R de calculer la moyenne dans un intervalle particulier:
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    m <- mean(pourcentages[0,8])
    Pareil pour la fonction abline(), peut-on lui dire de tracer la ligne en pointillée dans l'intervalle [0;8] de barplot(), donc uniquement les 8 premières barres de l'histogramme.

  12. #12
    Membre éclairé
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Janvier 2012
    Messages
    325
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Janvier 2012
    Messages : 325
    Points : 888
    Points
    888
    Par défaut
    Dans R les intervalles peuvent être facilement créés avec le signe ":".
    Par exemple 1:5 est identique à c(1,2,3,4,5).

    Du coup dans ton cas on aura un truc du style :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    m <- mean(pourcentages[1:9])
    Il y a aussi possibilité de faire des filtres quand tu veux faire des conditions sur les valeurs.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    > v=3:6
    > v
    [1] 3 4 5 6
    > v[1:2]
    [1] 3 4
    > v <= 4
    [1]  TRUE  TRUE FALSE FALSE
    > v[v <= 4]
    [1] 3 4

Discussions similaires

  1. Création d'un histogramme
    Par ajx12 dans le forum SAS STAT
    Réponses: 2
    Dernier message: 19/07/2010, 20h29
  2. [XI][graphe] Création d'un histogramme
    Par campia dans le forum SAP Crystal Reports
    Réponses: 9
    Dernier message: 16/11/2007, 08h32
  3. Réponses: 24
    Dernier message: 30/05/2007, 13h53
  4. Création d'un histogramme
    Par keumlebarbare dans le forum 2D
    Réponses: 1
    Dernier message: 26/05/2007, 11h18
  5. Création XLS avec histogramme
    Par ericw78 dans le forum Documents
    Réponses: 5
    Dernier message: 07/02/2006, 09h29

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo