Bonjour les amis,

Je devrais lancer une régression logistique avec R afin de déterminer les variables les plus adéquates d'un problèmatique.
Mais je suis confronté à deux petits soucis !

D'abord,
1. je voudrais me rassurer quel devrais être la taille nécessaire de mon échantillon des données pour espérer avoir un modèle proche de la réalité ?

2. Dans mon jeu des données, j'ai énormémement pas mal des données manquantes comment les traités avant de lancer le modèle ?

Merci de vos réponses !