Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques et Data Mining Discussion :

Variance corrigée et autres formules corrigées


Sujet :

Statistiques et Data Mining

  1. #1
    Membre expert
    Variance corrigée et autres formules corrigées
    Bonjour,

    J'ai ressorti mes vieux cours de fac (et oui cela sert encore ) pour rechercher une formule, la variance et la variance dite corrigée dont voici les formules :

    Code statistique :Sélectionner tout -Visualiser dans une fenêtre à part
    1
    2
    3
    VARIANCE VAR(X)=(∑(Xi²)÷N) - Xbarre²
    
    VARIANCE CORRIGé s²=∑((xi²)-n×Xbarre²)÷(n-1)


    Avec la variance j'arrive à calculer la Covariance , le Coefficient de corrélation R , le Coefficient de détermination R² , le Coefficient de variation .

    Dans le même acabit je souhaite trouver la formule pour calculer la Covariance dite " corrigée " . Le but de l'opération est d'avoir au final non plus 1 mais 2 équations y=ax+b. Avec un cas ou j'ai la donnée brute , l'autre cas ou a et b sont calculés a partir de données "corrigés" soit N-1 (avec N taille de ma population).

    Pour rappel la formule de la COVARIANCE

    Code statistique :Sélectionner tout -Visualiser dans une fenêtre à part
    COVARIANCE COV(XY)=[∑(XiYi)÷N]-(Xbarre× Ybarre)


    Code statistique :Sélectionner tout -Visualiser dans une fenêtre à part
    COVARIANCE CORRIGé COVcorr(XY)=????????


    Merci de l'aiguillage

  2. #2
    Membre expert
    Bonjour,

    Après renseignement pris auprès d'un statisticien voici les informations que j'ai eu :

    Variance et covariance corrigées sont calculées dans les estimations dans le cas d'un très petite population (moins de 5% de la population ou bien moins de 30 individus). Dans les deux cas, il suffit de multiplier la variance ou la covariance par n/(n-1) pour avoir ce que l'on appel "variance corrigée" et "covariance corrigée".
    On a donc deux équations y=ax+b , avec des différences pour le moins minime . Au final en combinant plusieurs méthodes d'estimations (standard, moyenne mobile, coefficient saisonnier ...) on peut faire de la comparaison de modèle et choisir le plus performant.

    Voici

###raw>template_hook.ano_emploi###