Vérifier si distribution gaussienne

**code_source** · 17/01/2011, 16h41

Bonjour,

Je dispose des données qui sont des vitesses (U,V,W) et j'aimerais vérifier si la distribution des vitesses suit une loi normale (gaussienne).

Si quelqu'un a une idée pour commencer, ça me sera très utile.

Merci.

**pseudocode** · 17/01/2011, 18h03

Il s'agit donc de faire ce qu'on appelle un "test de Normalité" ?

**code_source** · 17/01/2011, 18h12

Envoyé par pseudocode

Il s'agit donc de faire ce qu'on appelle un "test de Normalité" ?

Si j'ai bien compris, il faut que je représente les données sous forme d'histogramme puis de comparer la forme de cet histogramme avec une courbe représentant une loi normale (les paramètres de cette loi étant calculés à partir des données à analyser).

1/ A partir de mes données d'entrée, c'est à dire les trois composantes de vitesses, comment les représenter sous forme d'histogramme?
2/ Comment créer une courbe représentant une loi normale?

Merci pour votre aide

**pseudocode** · 17/01/2011, 18h19

Envoyé par code_source

Si j'ai bien compris, il faut que je représente les données sous forme d'histogramme puis de comparer la forme de cet histogramme avec une courbe représentant une loi normale (les paramètres de cette loi étant calculés à partir des données à analyser).

Si tu veux faire un test visuel, oui.

Il y a aussi des tests numériques (par exemple le K-squared) qui te permettent d'obtenir un pourcentage de probabilité.

1/ A partir de mes données d'entrée, c'est à dire les trois composantes de vitesses, comment les représenter sous forme d'histogramme?

Un histogramme est un compteur de valeurs. A chaque fois que la valeur "x" apparait, on incrémente le compteur correspondant.

2/ Comment créer une courbe représentant une loi normale?

La densité de probabilité d'une loi normale est une fonction gaussienne.

**code_source** · 17/01/2011, 18h29

Envoyé par pseudocode

Si tu veux faire un test visuel, oui.

Il y a aussi des tests numériques (par exemple le K-squared) qui te permettent d'obtenir un pourcentage de probabilité.

Un histogramme est un compteur de valeurs. A chaque fois que la valeur "x" apparait, on incrémente le compteur correspondant.

La densité de probabilité d'une loi normale est une fonction gaussienne.

Est ce que tu as un exemple ou on utilise des tests numériques (le K-squared)?

**pseudocode** · 17/01/2011, 18h43

Envoyé par code_source

Est ce que tu as un exemple ou on utilise des tests numériques (le K-squared)?

heu... non. Je pense me souvenir que c'est implémenté dans le module "stats" de Python.

Sinon toutes les formules sont dispo sur wikipedia : D'Agostino's K-squared test

**Nebulix** · 17/01/2011, 19h04

Envoyé par code_source

Je dispose des données qui sont des vitesses (U,V,W) et j'aimerais vérifier si la distribution des vitesses suit une loi normale (gaussienne).

Pour déterminer une loi de probabilité, il faut une infinité de données ( c'est beaucoup)
Avec un nombre fini de données, tu peux estimer une probabilité que ton tirage corresponde à une certaine loi de probabilité avec certains paramètres, ou que certains paramètres soient compatibles avec ...
Ton problème ne peut-il pas être mieux défini ?

**progfou** · 17/01/2011, 21h04

Envoyé par Nebulix

Pour déterminer une loi de probabilité, il faut une infinité de données ( c'est beaucoup)
Avec un nombre fini de données, tu peux estimer une probabilité que ton tirage corresponde à une certaine loi de probabilité avec certains paramètres, ou que certains paramètres soient compatibles avec ...
Ton problème ne peut-il pas être mieux défini ?

C'est faux, tu peux estimer une loi avec une certaine confiance. Plus tu as d'échantillons, et plus l'histogramme se rapprochera de celui de la distribution mais pour autant, il n'est pas nécessaire d'avoir une infinité de points...

Le problème est suffisamment défini, et la réponse de pseudocode y répond.

**Nebulix** · 18/01/2011, 10h08

Envoyé par progfou

C'est faux, tu peux estimer une loi avec une certaine confiance. Plus tu as d'échantillons, et plus l'histogramme se rapprochera de celui de la distribution mais pour autant, il n'est pas nécessaire d'avoir une infinité de points...

Le problème est suffisamment défini, et la réponse de pseudocode y répond.

La page wikipedia commence par :
.

The test is based on transformations of the sample kurtosis and skewness, and has power only against the alternatives that the distribution is skewed and/or kurtic.

Avec un nombre fini de données tu peux vérifier qu'elles ne sont pas en désaccord flagrant avec une loi. Vérifier la loi, c'est autre chose.