Bonjour à tous,
Je viens vers vous étant face à une difficulté.
Je serai bref : j'ai un tableur Excel avec, par exemple, 20 colonnes. La 21ème colonne est une variable à expliquer, au regard des 20 autres variables déterminantes. J'arrive donc à charger ma feuille sur R, je lance ma régression multiple, jusque là tout va bien.
Le problème, c'est que certaines des ces 20 colonnes ont des cellules vides, et je n'ai aucun message d'erreur lorsque je génère ma régression avec la formule glm. Je voulais donc savoir de quelle manière R les traitent-il ? Considère t-il que la valeur est donc de 0 ? Ou se contente t-il d'écarter la cellule, en sachant qu'il n'y a aucune valeur, et me calcule t-il donc la régression, et les coefficients (odds ratio) sans ces valeurs ?
Dans l’éventualité ou je ne serais pas clair, je prends un exemple : j'ai une variable à expliquer (ex : acceptation dans une prépa huppée non/oui) et 20 variables explicatives (ex: revenu des parents : X€), et parmi ces variables, je ne connais pas le revenu des parents dans certains cas. La cellule est donc vide.
Je vous remercie d'avance pour votre réponse.
Bonne journée à tous
Partager