Bonjour tout le monde,
Je suis en train de faire une analyse multivariée assez classique pour le moment et j'essaye de me représenter sur un même graphique plusieurs boxplot représentant une variable quantitative suivant les modalités d'une variable.
Jusqu'ici rien d'extraordinaire sauf que "beaucoup de données" (environ 100,000 par modalité) et surtout les données sont "brutes" et sont super super étalées mais globalement c'est souvent de cette forme :
Donc forcément la représentation est assez "écrasée" (logique) et j'essaye de trouver un moyen de représenter les données sans les "modifier" ou même sans enlever les valeurs extrêmes (environ une bonne centaine au dessus de 1000 par exemple donc assez important).
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6 Min. : 0.5 1st Qu.: 20 Median : 40 Mean : 60 3rd Qu.: 75 Max. :4000
En vous remerciant pour toute aide![]()
Cdlt,
Hollow
PS: d'ailleurs je n'arrive pas à avoir un résumé statistique de ma variable quantitative en fonction des modalités de ma variable qualitative, le summary(va.quanti ~ va.quali) ne fonctionne pas ... logique je pense mais si jamais quelqu'un a une idée je suis preneur également![]()
Partager