Bonjour, j'ai un problème avec la fonction scale_x_log10 du package ggplot2 de R.
Je vous explique mon problème.
J'ai deux variables (cov2_reduction et dnase_leaf) dont je voudrais faire un plot (j'utilise geom_point() pour afficher mes données).
Je voudrais afficher les log10 des données plutôt que les données elles-mêmes pour plus de lisibilité.
J'arrive à les afficher avec le code suivant.
p<- ggplot(data,aes(x=log(dnase_leaf,10),y=log(cov2_reduction,10))) +geom_point(alpha=1/2.5,color="red") + xlab("DHS") + ylab("Reduction") + ggtitle("Reduction VS DNAse hypersensitivity")
Mon problème arrive quand je veux afficher sur les axes, les échelles de données réelles, et non les valeurs en log10, avec scale_x(ou y)_log10().
p + scale_y_log10(breaks=c(0.16,0.25,0.5,1,1.5,2,2.5)) + scale_x_log10()
Pour une des variables (cov2_reduction en y) tout se passe bien, en revanche pour dnase_leaf (en x), j'ai un message d'erreur qui enlève en fait toutes mes données dont le log10 est inférieur à 0.
Messages d'avis :
1: In scale$trans$trans(x) : production de NaN
2: Removed 1541 rows containing missing values (geom_point).
Ma question est plutôt simple : y a-t-il un moyen d'afficher ces 1541 valeurs ?
Si je n'ai pas été clair, n'hésitez-pas à me poser des questions.
Merci pour votre aide !
Laura
Partager