Aide pour trouver une problématique de dataset
Bonjour,
Je suis étudiant et je suis des cours de statistique descriptive et analyse factorielles (ACP, AFC, ACM, kmeans cah) et je dois faire un projet avec dataset de notre choix répondant à une problématique
Le dataset que j'ai trouvé est super, car il y a N observation (grand) et 13 variables ( Dont 2 qualitatives et 11 quantitatives)
Type |
Acidité |
volatile acidité |
criti acidité |
residuals sugar |
chlorides |
free sulfur dic |
total sulfur |
density |
PH |
sulphates |
alcool |
quality |
White |
7 |
0.27 |
0.36 |
20.7 |
0.045 |
45 |
170 |
1.001 |
3 |
0.45 |
8.8 |
6 |
Je suis pas très bien sûr de moi même, j'ai posé comme problématique comme ceci:
1-est-ce que les vins blancs sont mieux présenté que les vins rouge? si oui que différencie les caractéristique des vins blancs ? et le vins rouges? (<- ACP pour répondre)
2- est-ce que la qualité de vin dépend aussi de degré de l'alcool? dès qu'un vin fort d'alcool est mieux qu'un vin avec peu d'alcool ? (<- ACP)
3- On peut avoir des groupe de vin homogène qui se ressemble ? (classification CAH puis K means)
Si vous pouvez me donner une idée de nouvelle problématique ca sera très sympa de vos part
Merci d'avance
Alex