Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > SAS STAT
SAS STAT Forum d'entraide sur les fonctionnalités liées à la statistique sur SAS : statistique descriptive, test, régression, classification
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 06/08/2011, 14h08   #1
Invité de passage
 
Homme
Étudiant
Inscription : juin 2011
Messages : 30
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Étudiant
Secteur : Industrie

Informations forums :
Inscription : juin 2011
Messages : 30
Points : 3
Points : 3
Par défaut Pertinence du modèle apres une regression logistique

Bonjour ,

J'ai fait une regression logistique, j'obtiens un modele de 9 variables avec l'aire sous la courbe de roc (c)=0.812 sur echant d'apprentissage.

Sous echant de validation, j'obtiens un modele 10 variables avec un c=0.837.
(ie le modèle sur apprentissage +1 variables)

Est il normal ? comment interpreter ce phenomene ?
c'est normal que le c roc d'apprent > c roc de validation ?

Merci
koulifanya est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 09/08/2011, 21h31   #2
Membre éprouvé
 
Homme Rémi Bousquet
responsable adjoint service stat
Inscription : mars 2009
Messages : 334
Détails du profil
Informations personnelles :
Nom : Homme Rémi Bousquet
Âge : 35
Localisation : France

Informations professionnelles :
Activité : responsable adjoint service stat
Secteur : Finance

Informations forums :
Inscription : mars 2009
Messages : 334
Points : 464
Points : 464
Tu n'es pas supposé faire un nouveau modèle sur ta base de validation, sinon ce n'est plus une base de validation !

Tu développe un modèle sur ta base de développement, et tu l'appliques à ta base de validation.
Si ton modèle est robuste, les deux courbes de roc sont proches.
Si ton modèle n'est pas robuste, celle de ta base de validation est bcp plus basse.

Quand à ton phénomène, si ta base de validation est plus petite (c'est souvent le cas), tu risques d'avoir un phénomène de sur-apprentissage plus important, et un accuracy ratio apparemment plus élevé.
RemiBousquet est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 12h48.


 
 
 
 
Partenaires

Hébergement Web