IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Removed 1 rows containing missing values (geom_segment)


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2019
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vaucluse (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2019
    Messages : 12
    Par défaut Removed 1 rows containing missing values (geom_segment)
    Bonjour à tous,

    Comme l'indique l'intitulé du sujet j'ai cette erreur qui apparaît sur mes ggplot et aucune données manquantes n'est répertoriées sur ma variable ci-dessous je vais vous montrer mon code (à noter que l'erreur apparaît 4 fois après l’exécution du code) :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
     
    ggplot(data3, aes(x=data3$tunnel, y=data3$ac_citrique, colour=data3$variete, fill=data3$variete))+
      geom_point(position=position_jitterdodge(dodge.width=0.7), size=2) +
      geom_boxplot(alpha=0.5, position = position_dodge(width=0.8), fatten=NULL)+
      scale_colour_manual(values=c(c("#FF0000", "#0000FF", "#006600","#0FFFFF")))+
      scale_fill_manual(values=c("#FF0000", "#0000FF", "#006600","#0FFFFF"))+
      stat_summary(fun.y = mean, geom = "errorbar", aes(ymax = ..y.., ymin = ..y..),
                   width=0.65,size = 1.5, linetype = "solid",position = position_dodge(width=0.7))+
      ylab("Ac. Citrique (g/100g MS)  ") + ggtitle("Part d'acide citrique pour les tunnels et les variétés") +
      theme_stata(scheme = "s2color")
    J'ai essayé de modifier les limites de mon graphique mais cela élargit juste l’échelle du graphique, il doit surement y avoir une erreur dans le code si vous avez besoin d'autres renseignements je suis là.

    J'ai un deuxième problème concernant une transformation de variables qui est considéré comme un facteur par r et quand je la change avec as.numeric() les valeurs sont complètement changées :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    > summary(data3$ac_malique)
    < 0,07   0,07   0,08   0,09    0,1   0,11   0,12   0,13   0,14   0,15   0,16   0,17   0,18 
         2      1      6      6      8      5      5      4      9      6      4      6      1 
      0,19    0,2   0,21   0,22   0,23   0,24   0,25   0,27   0,28   0,29    0,3   0,31   0,32 
         4      3      4      5      6      3      6      1      3      2      2      1      2 
      0,33   0,34   0,36   0,38    0,4   0,41   0,42   0,43   0,44   0,45   0,47    0,5   0,53 
         1      3      3      1      3      2      4      1      1      1      2      1      3 
      0,55   0,56   0,57   0,58   0,61   0,63   0,65   0,67   0,68   0,69   0,71   0,72   0,73 
         1      2      2      1      2      2      1      2      3      1      3      2      2 
      0,75   0,76   0,77   0,78   0,81   0,87   0,89   0,92   0,95   0,98      1   1,04    1,1 
         3      1      1      2      3      3      1      2      1      1      1      1      1 
      1,11   1,36   1,61 
         1      1      1
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    > str(data3$ac_malique)
     Factor w/ 68 levels "< 0,07","0,07",..: 32 47 16 26 66 16 22 23 17 15 ...
    Après transformation :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    > data3$ac_malique=as.numeric(data3$ac_malique)
    > str(data3$ac_malique)
     num [1:179] 32 47 16 26 66 16 22 23 17 15 ...
    Merci

  2. #2
    Membre éprouvé
    Homme Profil pro
    Ingénieur de recherche
    Inscrit en
    Décembre 2015
    Messages
    72
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Ingénieur de recherche
    Secteur : Agroalimentaire - Agriculture

    Informations forums :
    Inscription : Décembre 2015
    Messages : 72
    Par défaut
    Bonjour,

    sans le jeux de données, pas facile de donner une réponse exacte. Plusieurs pistes possibles :

    - Vérifier que toutes les variables utilisées (pas que x et y, mais aussi pour fill et color) soient sans données manquantes (ça a l'air d'être bon à priori)
    - Vérifier que les valeurs extrêmes du graphiques englobent les valeurs extrêmes de x et y
    - De même pour les barre d'erreur.
    - Vérifier que le nombre de couleur est identique au nombre de niveaux du facteur considéré.

    Je pense que pour savoir le lieu exact du problème, je repartirai d'un graphique très basique (sans les couleurs, que x et y) avec le boxplot et j'ajouterai les éléments au fur et à mesure pour savoir d'où vient le problème. Quelque chose du genre :

    Code R : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    ggplot(data3, aes(x=data3$tunnel, y=data3$ac_citrique))+
      geom_point(position=position_jitterdodge(dodge.width=0.7), size=2)

    Pour le deuxième point, il faut savoir que R stocke les facteurs sont formes d'entiers et le nombre associé correspond au niveau du facteur associé (car ils sont ordonnés). La valeur affiché est simplement un "label" et donc faire as.numeric() sur un facteur renvoie le niveau associé. Pour récupérer du coup le label (donc la valeur affichée), il faut passer entre temps par un format character qui permet de récupérer le label avant le le passer en numeric. Il faut donc faire as.numeric(as.character(data3$ac_malique))

    Cordialement

    VV

  3. #3
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Juin 2019
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Vaucluse (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2019
    Messages : 12
    Par défaut
    Merci pour votre réponse claire et construite j'ai utilisé votre technique pour trouver le problème et cela venait de la commande geom_boxplot() j'ai enlevé fatten=NULL.

    En ce qui concerne la variable en facteur c'est moi qui avais mal regardé les données 2 observations étaient indiquées comme suivant : "<0.07" et le signe inférieur considérait la variable en facteur, j'ai enlevé le signe depuis le CSV et c'est bon tout fonctionne.

    Bien cordialement,
    NS

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 1
    Dernier message: 23/04/2019, 11h46
  2. [DATA] Missing Values , Division By zero
    Par foxrol dans le forum SAS Base
    Réponses: 2
    Dernier message: 13/03/2012, 21h19
  3. ORA-00926: missing VALUES key
    Par anis-2005 dans le forum PL/SQL
    Réponses: 13
    Dernier message: 02/09/2011, 11h53
  4. Invalid web service call, missing value for parameter
    Par lutecefalco dans le forum ASP.NET
    Réponses: 4
    Dernier message: 10/03/2010, 15h01
  5. [DATA] missing values dans l'importation depuis SPSS
    Par Claude_S dans le forum SAS Base
    Réponses: 8
    Dernier message: 22/07/2009, 09h38

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo