Bonjour
j'ai une base de donnée de 36 variables et 15000 observation je veux detecter les valeurs extremes j'ai appliqué la boite a moustache j'ai le résultat mais je veux connaitre les observation abberrantes je sais pas comment faire ( sortir les observation de la base de donnée)
voila un extrait de ma base de donnée
V1 V2 V3 V4 V5 v6 V7
0.0177489 5.74543 18.0 162.0 11.3043 301.676 4888.14
0.0177794 5.96406 16.5 162.5 11.3038 301.674 4888.23
0.0177489 5.74543 17.25 162.0 11.3247 301.676 4888.39
0.0177489 5.74543 18.0 162.0 11.3456 301.676 4888.54
0.0177794 5.96406 15.0 162.5 11.3037 301.674 4888.32
0.0177794 5.96406 15.75 162.5 11.3243 301.674 4888.49
0.0177794 5.96406 16.5 162.5 11.3451 301.674 4888.65
0.0177489 5.74543 17.25 162.0 11.3659 301.676 4888.8
Voila un extrait de mon code :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 import pickle import numpy as np import matplotlib.pyplot as plt data=pickle.load(open("test.pkl","rb")) var=data.keys () fs=10 fig3, axes = plt.subplots(nrows=2, ncols=3, figsize=(6, 6)) axes[0, 0].boxplot([data[var[0]]],0,sym='g.') axes[0, 1].boxplot([data[var[1]]],0,'g.') axes[0, 2].boxplot([data[var[3]]],0,'g.') axes[1, 0].boxplot([data[var[4]]],0,'g.') axes[1, 1].boxplot([data[var[6]]],0,'g.') axes[1, 2].boxplot([data[var[7]]],0,'g.') plt.savefig('boitemoustache1.png')
Partager