Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Rédacteur

    Critique de livre "Etude de cas en statistique décisionnelle"
    Je vous propose le nouveau livre de Stéphane Tuffery qui est une étude de cas sur la mise en place d'un score avec SAS.

    Le lilvre est riche de l'expérience de l'auteur, de code, d'explications etc ...

    Référence : http://www.editionstechnip.com/F/tuf...tique_1658.asp

    Niveau : Débutant, intermédiaire
    N'oubliez pas de cliquer sur lorsque votre problème est réglé !

  2. #2
    Candidat au Club
    Etude de cas de Stephane TUFFERY: comment récupérer le modèle agrégé dans le Bagging ?
    Bonjour,
    Je travaille sur un projet de scoring par la méthode de Bagging avec SAS.

    L'exemple illustré dans l'ouvrage "Etude de cas en statistique décisionnelle" m'a beaucoup inspiré.

    Je rencontre une grande difficulté c'est : comment récupérer le model agrégé ?

    Comme dans la session 2.23 dulivre, je fais du Bootstrap avec une proc Logistic, je récupère bien les proba dans la table Out=Logit.

    Ensuite une boucle qui permet d'agréger et moyenner les proba pour avoir la table Bagging_Agreg.

    Dans cette table on a bien pour chaque individu la proba agrégée. Sachant que l’instruction OUTMODEL= TABLE_MODEL_&Iter donne le modèle logistique de chaque itération,

    Comment avoir l’équation du modèle agrégé ? Et de fait la table du modèle agrégé ?

    Merci beaucoup pour votre aide.

  3. #3
    Expert confirmé
    Bonjour.
    Je pense que les coefficients sont les moyennes de tous les coefficients des modèles du bagging (le bagging est un bootstrap). Donc PROC SQL ou PROC MEANS sur tes jeux de coefficients, à récupérer par exemple avec ODS OUTPUT parameterEstimates = tableSAS ; avec des groupes par combinaison variable * modalité.
    Par contre, si tes prédictions actuelles sont les moyennes des probas prédites, et que tu veux pouvoir continuer le même calcul, il faudrait garder tous les jeux de coefficients des modèles.

    Cela dit, comme logit est une fonction monotone, l'ordre dans lequel sont ordonnées les prédictions ne changera pas selon que tu utilises les moyennes des probas prédites par chaque modèle ou que tu prennes les coefficients moyens et que tu en dérives une proba.
    Bon courage.
    Olivier

###raw>template_hook.ano_emploi###