Bonjour,
Je dispose des données qui sont des vitesses (U,V,W) et j'aimerais vérifier si la distribution des vitesses suit une loi normale (gaussienne).
Si quelqu'un a une idée pour commencer, ça me sera très utile.
Merci.
Bonjour,
Je dispose des données qui sont des vitesses (U,V,W) et j'aimerais vérifier si la distribution des vitesses suit une loi normale (gaussienne).
Si quelqu'un a une idée pour commencer, ça me sera très utile.
Merci.
Il s'agit donc de faire ce qu'on appelle un "test de Normalité" ?
ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.
Si j'ai bien compris, il faut que je représente les données sous forme d'histogramme puis de comparer la forme de cet histogramme avec une courbe représentant une loi normale (les paramètres de cette loi étant calculés à partir des données à analyser).
1/ A partir de mes données d'entrée, c'est à dire les trois composantes de vitesses, comment les représenter sous forme d'histogramme?
2/ Comment créer une courbe représentant une loi normale?
Merci pour votre aide
Si tu veux faire un test visuel, oui.
Il y a aussi des tests numériques (par exemple le K-squared) qui te permettent d'obtenir un pourcentage de probabilité.
Un histogramme est un compteur de valeurs. A chaque fois que la valeur "x" apparait, on incrémente le compteur correspondant.1/ A partir de mes données d'entrée, c'est à dire les trois composantes de vitesses, comment les représenter sous forme d'histogramme?
La densité de probabilité d'une loi normale est une fonction gaussienne.2/ Comment créer une courbe représentant une loi normale?
ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.
heu... non. Je pense me souvenir que c'est implémenté dans le module "stats" de Python.
Sinon toutes les formules sont dispo sur wikipedia : D'Agostino's K-squared test
ALGORITHME (n.m.): Méthode complexe de résolution d'un problème simple.
Pour déterminer une loi de probabilité, il faut une infinité de données ( c'est beaucoup)
Avec un nombre fini de données, tu peux estimer une probabilité que ton tirage corresponde à une certaine loi de probabilité avec certains paramètres, ou que certains paramètres soient compatibles avec ...
Ton problème ne peut-il pas être mieux défini ?
C'est faux, tu peux estimer une loi avec une certaine confiance. Plus tu as d'échantillons, et plus l'histogramme se rapprochera de celui de la distribution mais pour autant, il n'est pas nécessaire d'avoir une infinité de points...
Le problème est suffisamment défini, et la réponse de pseudocode y répond.
Une contribution MATLAB (non testée) : D'Agostino-Pearson's K2 test
La page wikipedia commence par :
.Avec un nombre fini de données tu peux vérifier qu'elles ne sont pas en désaccord flagrant avec une loi. Vérifier la loi, c'est autre chose.The test is based on transformations of the sample kurtosis and skewness, and has power only against the alternatives that the distribution is skewed and/or kurtic.
Merci beaucoup pour vos réponses. Maintenant, j'essaie de tester l'algorithme de D'Agostino-Pearson's K2 sur mes propres données. Mes données de vitesses comportent des NaN (traitement que j'ai effectué avant). Est ce qu'il est judicieux que je laisse les NaN ou bien les remplacer soit par des zéros ou par des [];
Sachant qu'en remplaçant les NaN par des zéros, il me sort une erreur:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 U(find(isnan(U)))=[]; % ou bien U(find(isnan(U)))=0;
Voici un exemple de ma vitesse axiale
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 ???Edges vector must be monotonically non-decreasing.
Un simple avis :
- Si Nan est le résultat d'un calcul, mais que tu sais que les points existent bien, trouve un moyen de les calculer correctement
- sinon, enlève les.. Les remplacer par zéro changera le problème.
Si tu as des NAN (surtout en tel nombre) c'est que tes données sont peu fiables (au mieux ) ou erronnées. Faire des stats avec ça est osé !
Je commencerais par revoir ces données jusqu'à avoir quelque chose que je comprends.
@souviron
Les formulations les plus restrictives me paraissent les mieux adaptées au pouvoir prédictif réel des statistiques, que l'on a beaucoup trop tendance à surestimer (surtout avec des petits échantillons)
Partager