IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques, Data Mining et Data Science Discussion :

Statistiques: identification de pics dans un échantillon de données


Sujet :

Statistiques, Data Mining et Data Science

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre habitué
    Profil pro
    Inscrit en
    Octobre 2007
    Messages
    10
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations forums :
    Inscription : Octobre 2007
    Messages : 10
    Par défaut Statistiques: identification de pics dans un échantillon de données
    Bonjour,

    j'aurais besoin d'un peu de théorie ou de retour d'expérience en statistiques, et je pense que le forum de Math est le plus pertinent

    je dois faire des statistiques / un audit sur les fréquences de lancement de traitements, leurs durées, la répartition de lancement de ces traitements dans la journée, dans la semaine, dans le mois, éventuellement par tranche horaire etc etc
    Ceci pour identifier les problèmes de surcharge de la machine de production, identifier les traitements qui durent trop longtemps blah blah bleeeeeeeeeeeuarh

    pour le moment, l'expression du besoin est plus que floue, mais en gros j'en suis arrivé à la conclusion qu'il fallait identifier les éventuels pics d'activités, de durée etc. mais je ne sais pas comment identifier ces pics.
    par exemple concernant les durées de traitement, dois comparer la durée d'un traitement avec la durée moyenne du traitement sur un échantillon donné, et l'identifier comme pic au de là d'un certaine différence, d'un certain coefficient? (la notion d'écart type peut-elle me servir?


    Dans un deuxième temps il faudra peut-être aussi que je traite des tableaux à 3 dimensions, sans les outils adéquats donc il se peut que je revienne chouiner dans le coin, pour que vous m'aiguilliez sur des algorythmes connus et reconnus

    Merci pour votre aide.

  2. #2
    Rédacteur
    Avatar de Zavonen
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    1 772
    Détails du profil
    Informations personnelles :
    Âge : 78
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 1 772
    Par défaut
    (la notion d'écart type peut-elle me servir?
    Ce paramètre mesure l'hétérogénéité d'un ensemble de valeurs.
    Tout dépend de ce que l'on veut faire...
    Soit on veut 'en moyenne' avoir des valeurs plutôt homogènes, sans se soucier de débordements rares mais qui peuvent être importants, soit on veut faire la chasse aux cas 'pathologiques' s'écartant trop de la moyenne.
    Les deux démarches sont différentes. Dans le second cas la 'pathologie' doit être définie par un % d'écart par rapport à la moyenne (seuil de tolérance), on cherche donc à détecter, puis éventuellement à éliminer ces cas, ce quin de facto, réduira l'écart-type par 'écrétage'.
    Ce qu'on trouve est plus important que ce qu'on cherche.
    Maths de base pour les nuls (et les autres...)

  3. #3
    Membre habitué
    Profil pro
    Inscrit en
    Octobre 2007
    Messages
    10
    Détails du profil
    Informations personnelles :
    Localisation : Canada

    Informations forums :
    Inscription : Octobre 2007
    Messages : 10
    Par défaut
    merci pour la réponse.

    dans la grande majorité des cas, je rencontrerai le deuxième cas.
    que devrais-je prendre pour seuil de tolérance? 20%, 30%, 50% ?
    sachant que pour le moment, je ne sais pas trop trop où je vais.

    merci.

  4. #4
    Rédacteur
    Avatar de Zavonen
    Profil pro
    Inscrit en
    Novembre 2006
    Messages
    1 772
    Détails du profil
    Informations personnelles :
    Âge : 78
    Localisation : France

    Informations forums :
    Inscription : Novembre 2006
    Messages : 1 772
    Par défaut
    Je crois que cela est une donnée du problème pratique que tu as à résoudre, et que faute de plus amples informations personne ici ne peut dire ce qui est 'acceptable' et ce qui ne l'est pas.
    Ce qu'on trouve est plus important que ce qu'on cherche.
    Maths de base pour les nuls (et les autres...)

Discussions similaires

  1. Réponses: 1
    Dernier message: 01/07/2013, 09h39
  2. identification CAS précis dans une requête
    Par plutonium719 dans le forum Développement
    Réponses: 3
    Dernier message: 10/03/2008, 12h09
  3. Marquage de pics dans une figure
    Par jena dans le forum Signal
    Réponses: 5
    Dernier message: 13/02/2007, 19h27
  4. Identification d'accès dans un formulaire
    Par gloglo dans le forum Struts 1
    Réponses: 1
    Dernier message: 18/07/2006, 14h07
  5. algorithme detection de pics dans une courbe
    Par bfb dans le forum Algorithmes et structures de données
    Réponses: 11
    Dernier message: 31/03/2006, 11h08

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo