Bonjour,

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
#Importer le jeu de données
Dataset <- read.table("/Users/Desktop/card.txt", 
  header=TRUE, sep=";", na.strings="NA", dec=".", strip.white=TRUE)
 
#Modèle régression multiple  
LinearModel.1 <- lm(LWAGE ~ EDUC +EXPER +EXPERSQ + SMSA +SOUTH, data=Dataset)
summary(LinearModel.1)
 
#estimer la Forme Réduite de EDUC avec FATHEDUC et MOTHEDUC
ehat1<-lm(EDUC ~ EXPER+EXPERSQ+SMSA+SOUTH+FATHEDUC+MOTHEDUC,data=Dataset)
summary(ehat1)
ehat2<-lm(LWAGE ~ fitted(ehat1)+EXPER+EXPERSQ+SMSA+SOUTH, data=Dataset)
summary(ehat2)
La fin de mon code R ne fonctionne pas, plus précisément à partir de ehat2.
Erreur dans model.frame.default(formula = LWAGE ~ fitted(ehat1) + EXPER + : les longueurs des variables diffèrent (trouvé pour 'fitted(ehat1)')
Est-ce que cela serait dû au fait que la variable FATHEDUC a 690 non réponses (NA) et la variable MOTEDUC en a 353 ,alors que les autres variables n'en ont aucune ?
Comment remédier à ce problème ?

Merci de vos suggestions.