Bonjour,
je dois supprimer de ma base toute valeur supérieur à (Moyenne+5*écart type) ou inférieur à (Moyenne-5*écart type) et ceci pour toute les colonnes de la base de données.
Merci
Bonjour,
je dois supprimer de ma base toute valeur supérieur à (Moyenne+5*écart type) ou inférieur à (Moyenne-5*écart type) et ceci pour toute les colonnes de la base de données.
Merci
C'est sur que comme ça, sans DDL, sans la moindre information sur la base, on va pouvoir aider et répondre juste à 100%.
Dans le doute, un NOT BETWEEN pourrait répondre à la solution côté bornes + et -
Pour le reste, sans modèle de données, et avec si peu d'indication, s'aventurer à donner une réponse me semble compromis.
Cordialement,
Lyche
Rejoignez la communauté du chat et partagez vos connaissances ou vos questions avec nous
Mon Tutoriel pour apprendre les Agregations
Consultez mon Blog SQL destiné aux débutants
Pensez à FAQ SQL Server Ainsi qu'aux Cours et Tuto SQL Server
Bonjour,
il manque une question à ton post, et d'autres informations qui pourraient être importantes, mais je suppose que tu veux faire quelque chose comme ça.
Les points d'interrogation ?? dépendent de tes critères exacts. Si tu pouvais être plus précis, je pourrais peut être l'être plus.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10 WITH SRC AS ( SELECT * , Moyenne = AVG( LaColonne ) OVER ( PARTITION BY ?? ) , Deviation = STDEV( LaColonne) OVER ( PARTITION BY ?? ) FROM LaTable ) DELETE FROM SRC WHERE LaColonne > Moyenne + 5 * Deviation![]()
Rebonjour,
Alors la base de données est composée de prélèvements d'eau qui ont été effectués dans 4 stations avec 33 paramètres physico-chimiques(manganèse, Sodium, oxygène dissous,...) dans chaque prélèvement: Il s'agit d'une matrice des prélèvements en ligne et des paramètres en colonnes.
Je cherche à supprimer les points aberrants :toute valeur "NOT BETWEEN" (Moyenne(colonne)-5*écart type(colonne)) et (Moyenne(colonne)+5*écart type(colonne)) pour chaque une des 33 colonnes (manganèse, Sodium, oxygène dissous,...).
Hmmmm, donc si y'a une importante pollution dans la nappe phréatique, on supprime les lignes et on ne lance pas d'alerte ?
Ah ben je comprends mieux certaines choses comme un certain nuage qui n'a pas passé la douane en 1986...![]()
Hmmmmm, vous avez tout comprissauf ma question bien sûr
![]()
Questions:
- Hormis les paramêtres physico-chimiques, y a-t-il d'autres colonnes et dans ce cas, lesquelels?
- Si l'on trouve une ligne contenant une valeur aberrante, faut-il juste ignorer la valeur aberrante, ou toute la ligne?
- La table doit-elle vraiment être modifiée, ou bien faut-il juste ignorer les résultats dans la requête finale?
Partager