Bonjour,

Je suis étudiant et je suis des cours de statistique descriptive et analyse factorielles (ACP, AFC, ACM, kmeans cah) et je dois faire un projet avec dataset de notre choix répondant à une problématique

Le dataset que j'ai trouvé est super, car il y a N observation (grand) et 13 variables ( Dont 2 qualitatives et 11 quantitatives)

Type Acidité volatile acidité criti acidité residuals sugar chlorides free sulfur dic total sulfur density PH sulphates alcool quality
White 7 0.27 0.36 20.7 0.045 45 170 1.001 3 0.45 8.8 6


Je suis pas très bien sûr de moi même, j'ai posé comme problématique comme ceci:

1-est-ce que les vins blancs sont mieux présenté que les vins rouge? si oui que différencie les caractéristique des vins blancs ? et le vins rouges? (<- ACP pour répondre)
2- est-ce que la qualité de vin dépend aussi de degré de l'alcool? dès qu'un vin fort d'alcool est mieux qu'un vin avec peu d'alcool ? (<- ACP)
3- On peut avoir des groupe de vin homogène qui se ressemble ? (classification CAH puis K means)

Si vous pouvez me donner une idée de nouvelle problématique ca sera très sympa de vos part

Merci d'avance

Alex