Bonjour à tous,
J’aimerais faire un loop de régression. En effet je veux expliquer la variable (duree_croissance) en première colonne (j’ai créé un petit fichier en pièce joint pour exemple) en fonction des autres variables (ici colonnes 2 à 6) (en vrai j’en ai plus de 200 c’est pourquoi je veux faire un loop).
Je veux donc faire des régressions et plot avec à chaque fois les données de la colonne 1 « duree_croissance » avec la colonne 2, puis avec la colonne 3, puis la 4, etc… J’utilise les fonctions « lm », « anova », « summary » et « sigma » afin d’avoir les résultats désirés. Sachant que j'ai des "NA" dans mon fichier donc j'en ai mis dans le fichier en pièce jointe, je pense que ça va poser probleme et qu'il faut éviter les NA pour les régressions.
Est-il possible de faire un loop pour avoir donc toutes ces reg (col 1 ~ col2, col 1 ~ col3, col1 ~ col4 , etc..) sans avoir à écrire toutes les régressions lm et que la boucle prenne elle-même les colonnes l’une après l’autre pour faire des régressions en fonction de la colonne 1 puis à chaque fois un plot avec la droite de régression, l’équation et le R² ?
J’aimerais aussi créer un nouveau data. frame avec les coefficients suivants : a, b, R² adjusted, R², N, pvalue, RMSE et n (nombre de ligne) de toutes les régressions. Je sais comment trouver ces paramètres et les imprimer pour une seule régression mais pas pour une boucle.
Merci par avance et bonne soirée.fleurs.txt
Partager