Bonjour tout le monde,
J'ai besoin de votre aide, je suis un étudiant en marketing et je suis vraiment bloqué sur quelques exercices vous valider une matière (Python) pouvez-vous m'aider s'il vous plait.
voici les exercices en question :
QUESTION 1
On s'intéresse dans cette question à l'estimateur des moindres carrés.
On rappelle que celui-ci s'écrit de la forme suivante : β̂ =(X⊤X)−1X⊤*y pour une matrice d'observation X et un vecteur à expliquer y.
Et y=(1,...,1)t∈R8
On choisit y∈ℝ8, et pour X∈ℝ8×8 on prend X=I8+E où la matrice I8 est la matrice identité de taille 8, et E est la matrice partout nulle sauf le dernier élément de la première ligne qui vaut 1 (i.e. E1,8=1)
Utiliser la librairie Numpy pour construire la matrice et calculer la valeur de la somme ∑8i=1βi
Entrez la valeur de la somme ∑8i=1βi :
QUESTION 2
Donner le rang de la matrice X⊤X−I8 (on pourra le faire numériquement en utilisant la fonction np.linalg.eigvals de Numpy) :
QUESTION 3
Importer la base de données disponibles http://archive.ics.uci.edu/ml/machin...lity-white.csv
Créer une matrice Z qui contient les 11 premières colonnes et toutes les lignes du tableau. On prendra pour y le vecteur qui contient la dernière colonne de ce tableau. On aura donc une matrice Z de taille 4898×11.
On reprend l'estimateur des moindres carrés proposé ci-dessus:
β̂ Z=(Z⊤Z)−1Z⊤y.
Donner la valeur des résidus obtenus: ∥Zβ̂ Z−y∥22 ?
On ne donnera que la partie entière de ce nombre.
QUESTION 4
On propose maintenant de faire un pré-traitement classique sur les colonnes de Z, que l’on appelle classiquement “standardisation des variables”. Cela consiste à retirer à chaque colonne sa moyenne, puis à la diviser par son écart-type. Après standardisation, chaque colonne a une moyenne nulle et une variance de 1.
Implémenter la standardisation sur la matrice Z précédente. On note X la matrice ainsi obtenue. On reprend l'estimateur des moindres carrés proposé ci-dessus, cette fois pour la matrice X: β̂ X=(X⊤X)−1X⊤y.
Donner la valeur de ∥Xβ̂ X−y∥22:
Merci par avance
Kev
Partager