Bonjour,
est ce que le nombre de variable a une influence sur la qualité d'un modèle (logistique par exemple)
ou sur l'estimation?
merci infiniment d'avance pour toute réponse
Bonjour,
est ce que le nombre de variable a une influence sur la qualité d'un modèle (logistique par exemple)
ou sur l'estimation?
merci infiniment d'avance pour toute réponse
Oui, il y a un impact : si tu ajoutes des variables qui n'ont aucun rapport avec ce que tu cherches à prédire, tu abaisseras la qualité de ta prédiction ; si tu ajoutes des variables explicatives de bonne qualité, ton modèle fera un bon énorme en qualité. C'est pour ça qu'on parle de sélection des variables.
Le plus gros problème, en fait, serait qu'il y ait un lien statistique entre la variable que tu ajoutes et la sortie pour l'apprentissage, mais aucun en réalité : tu augmentes le risque de surapprentissage…
Vous souhaitez participer aux rubriques Qt (tutoriels, FAQ, traductions) ou HPC ? Contactez-moi par MP.
Créer des applications graphiques en Python avec PyQt5
Créer des applications avec Qt 5.
Pas de question d'ordre technique par MP !
Bonjour,
comment vérifier qu'il n'y a pas de sur apprentissage dans le modèle final (logistique en particulier ) ?
merci infiniment d'avance pour toute réponse
Bonjour,
Je m'interroge sur ta première question dans la mesure ou les logiciels de statistique en générale t'informent des variables qui sont pertinentes ou pas dans une régression quelconque.
Pour t'assurer que ton modèle n'est pas en surapprentissage, tu peux découper tes données en deux parties. Un jeu d'apprentissage qui représente environ 70% de tes données et un jeu test pour évaluer ton modèle avec le reste.
Au plaisir de te lire.
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager