Bonjour,
Je débute avec python et je dois opérer une régression linéaire avec 12 variables (x) et 1 constante (y).
Je rentre le code ci-dessous pour avoir la régression linéaire. Néanmoins, j'aimerais avoir le R^2 ajustée le plus haut possible. Auriez-vous une solution pour compléter le code et m'éviter de tâtonner? Il me semble qu'avec des conditions, ont peu trouver, néanmoins débutant, je ne sais pas comment faire.
Merci de votre aide.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 import os import pandas as pd import statsmodels.formula.api as smf root = os.getcwd() print (root) xlsx_file = os.path.join(root,'Exam','housing.xlsx') print (xlsx_file) df_raw = pd.read_excel (xlsx_file) print (df_raw) model = smf.ols(formula = "MEDV ~ CRIM+LSTAT+NOX+DIS+RAD+CHAS+PTRATIO+INDUS+ZN+RM+AGE+TAX",data = df_raw).fit() print (model.summary())
Partager