Bonjour,
J'apprends à utiliser R à partir de données de santé (je travaillais sous SAS avant). Dans mon étude, je cherche à réaliser une régression logistique sur un grand échantillon d'individus. La variable à expliquer est binaire : annonce réalisée par un médecin (oui / non). J'ai beaucoup de variables explicatives dans mon modèle, donc toutes les sous-catégories testées ne comptent pas 5 personnes. Toutefois, je vérifie les effectifs des p-values significatives, pour être sure de ne pas dire d'âneries en cas de trop petits effectifs … Dans ma base, j'ai une variable de pondération, qui tient compte de l'incidence du cancer et qui permet de minimiser le poids des femmes qui ont un cancer du sein, qui étaient surreprésentées.
J'aimerais savoir pourquoi R me précise qu'il y a un nombre de succès non entier dans un glm binomial dès que j'ajoute cette variable "weights" ? Il ne me précise rien lorsque je ne la mets pas … ?
Du coup est-ce que je peux utiliser la famille "quasibinomial" et qu'est-ce que cela change dans l'interprétation des résultats ? Je vous remercie d'avance pour votre aide, si ma question ne vous parait pas trop décalée pour ce forum …. !
Bien à vous,
Lucie
Voici mon script R
mod1<-glm(An_med~Sexe+Age+Niveau_dip+CSP+Revenus+CouvS+Taille_agglo+Region+Statut_fam+Temps_moyen+Lieux_soins_1+Type_Kc+TTT+Comorbidite+Recidive, data=base_test, family="binomial", weights = Poids)
Warning message:
In eval(family$initialize) :
nombre de succès non entier dans un glm binomial !
Partager