Bonjour,
Je débute avec python et je dois opérer une régression linéaire avec 12 variables (x) et 1 constante (y).
Je rentre le code ci-dessous pour avoir la régression linéaire. Néanmoins, j'aimerais avoir le R^2 ajustée le plus haut possible. Auriez-vous une solution pour compléter le code et m'éviter de tâtonner? Il me semble qu'avec des conditions, ont peu trouver, néanmoins débutant, je ne sais pas comment faire.
Merci de votre aide.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
 
import os 
import pandas as pd
import statsmodels.formula.api as smf
 
root = os.getcwd()
print (root)
 
xlsx_file = os.path.join(root,'Exam','housing.xlsx')
print (xlsx_file)
df_raw = pd.read_excel (xlsx_file)
print (df_raw)
 
model = smf.ols(formula = "MEDV ~ CRIM+LSTAT+NOX+DIS+RAD+CHAS+PTRATIO+INDUS+ZN+RM+AGE+TAX",data = df_raw).fit()
print (model.summary())