1. #1
    Membre à l'essai
    Homme Profil pro
    Inscrit en
    mai 2012
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Morbihan (Bretagne)

    Informations forums :
    Inscription : mai 2012
    Messages : 12
    Points : 15
    Points
    15

    Par défaut Besoin d'aide pour des notions de statistique

    bonjour à tous!
    Les statistiques sont pour moi un lointain souvenir... et j'aurais donc besoin de votre aide pour un petit problème pratique.
    J'ai ce genre de données:
    J'y observe qu'en dessous de 250 utilisateurs, j'ai très peu d'incidents. Mais quand on passe ce seuil, boom, ça explose.
    Je cherche une notion de statistique qui me permettrait d'identifier ce seuil à ne pas dépasser (de 200 à 249) ou alors le premier seuil qui dépasse(de 250 à 299) cela m'irait aussi. Est-ce que quelqu’un pourrait m'aider s’il vous plaît?
    [['de 0 à 49 : ' 3]
    ['de 50 à 99 : ' 2]
    ['de 100 à 149 : ' 1]
    ['de 150 à 199 : ' 4]
    ['de 200 à 249 : ' 22]
    ['de 250 à 299 : ' 128]
    ['de 300 à 349 : ' 250]
    ['de 350 à 399 : ' 330]
    ['de 400 à 449 : ' 172]
    ['de 450 à 499 : ' 82]
    ['de 500 à 549 : ' 22]
    ['de 550 à 599 : ' 9]]

  2. #2
    Rédacteur/Modérateur

    Homme Profil pro
    Ingénieur qualité méthodes
    Inscrit en
    décembre 2013
    Messages
    1 600
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur qualité méthodes
    Secteur : Conseil

    Informations forums :
    Inscription : décembre 2013
    Messages : 1 600
    Points : 3 335
    Points
    3 335

    Par défaut

    Il y a un truc surprenant qui me fait réagir dans tes données, c'est que au delà de 400 utilisateurs, le nombre d'incidents diminue.
    C'est contraire à la logique... et donc, peut-être que les données ne représentent pas ce qu'on imagine.

    J'imagine que tes vraies données , c'est ça : Tu as un site internet ( par exemple, ça peut être tout à fait autre chose). Pour chaque jour, tu as d'une part le nombre de connexions, et le nombre d'incidents.

    ex : 1er Janvier 2017 : 260 connexions, 2 incidents
    etc etc..
    Et tu fais une synthèse : Pour tous les jours où il y a eu entre 250 et 299 connectés, au total, j'ai eu 128 incidents.
    Mais dans ta synthèse, tu ne dis pas si les jours avec 250 à 299 connectés, ça représente 150 jours , ou 300 jours, ou 3 jours
    En fait, j'imagine que tes données, si on rajoutait la colonne nombre de nours, elles ressembleraient à ça :

    [['de 0 à 49 : ' 3 2 jours ]
    ['de 50 à 99 : ' 2 2 jours]
    ['de 100 à 149 : ' 1 3 jours ]
    ['de 150 à 199 : ' 4 4 jours]
    ['de 200 à 249 : ' 22 5 jours]
    ['de 250 à 299 : ' 128 25 jours]
    ['de 300 à 349 : ' 250 40 jours]
    ['de 350 à 399 : ' 330 50 jours ]
    ['de 400 à 449 : ' 172 22 jours ]
    ['de 450 à 499 : ' 82 10 jours]
    ['de 500 à 549 : ' 22 2 jours]
    ['de 550 à 599 : ' 9 1 jour ]]

    On donc on pourrait dire :

    Tu as très peu d'incident quand tu as plus de 500 connexions, mais c'est parce que tu as très rarement plus de 500 connexions. A chaque fois que tu as plus de 500 connexions, tu as une dizaine d'incidents dans la journée, contre 5 ou 6 incidents par jour les jours 'moyens'.

    Du coup, on pourrait calculer le nombre d'incidents par jour, selon le nombre de connexions. Et on aurait une courbe plus significative.
    N'oubliez pas le bouton Résolu si vous avez obtenu une réponse à votre question.

  3. #3
    Membre à l'essai
    Homme Profil pro
    Inscrit en
    mai 2012
    Messages
    12
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Morbihan (Bretagne)

    Informations forums :
    Inscription : mai 2012
    Messages : 12
    Points : 15
    Points
    15

    Par défaut héhé

    Merci pour ta réponse! Tu vois vite les choses
    sans aller aussi loin, et pour simplifier le tableau, si j'ai ça:
    1:3
    2: 2
    3: 1
    4: 4
    5: 22
    6: 128
    7: 330
    etc.

    comment puis-je avec une formule pour mesurer le changement brutal entre des valeurs qui ont une moyenne autour de la dizaine, et d'autres qui passent directement au dessus de la centaine?
    Et donc comment identifier le seuil de déclenchement des gros incidents?

Discussions similaires

  1. Besoin d'aide pour des viewer de log
    Par Djobird dans le forum Logging
    Réponses: 3
    Dernier message: 12/03/2010, 11h21
  2. Besoin d'aide pour des requêtes
    Par pikmin dans le forum SQL
    Réponses: 10
    Dernier message: 10/12/2009, 15h33
  3. Besoin d'aide svp [ des notions à expliquer ]
    Par Nabsouf dans le forum Débuter
    Réponses: 1
    Dernier message: 26/06/2009, 13h51
  4. Besoin d'aide pour des jointures de tables
    Par supersmoos dans le forum Requêtes
    Réponses: 4
    Dernier message: 14/12/2006, 16h38
  5. besoin d'aide pour des algos
    Par mathieu77 dans le forum Général Algorithmique
    Réponses: 23
    Dernier message: 08/11/2005, 19h33

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo