Précédent   Forum des professionnels en informatique > Logiciels > Solutions d'entreprise > Business Intelligence > SAS > Macro
Macro Forum d'entraide sur le langage Macro de SAS
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 23/02/2011, 10h05   #1
Membre habitué
 
Homme Julien
Ingénieur d'études / Biostatisticien
Inscription : décembre 2009
Messages : 304
Détails du profil
Informations personnelles :
Nom : Homme Julien
Localisation : France

Informations professionnelles :
Activité : Ingénieur d'études / Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : décembre 2009
Messages : 304
Points : 101
Points : 101
Par défaut Recherche macro modélisation et classification

Bonjour, j'aimerais savoir si certains connaissent des sites ou je peux trouver les macros pour les méthodes d'analyse multivariée suivantes:
- Arbre de décision
- Forêt aléatoire
- Support vector machine
- Méthode des K plus proche voisin pondéré (je sais que SAS fait du KNN par PROC CLUSTER)
- Courbe ROC multiple
- Algorithme de combinatoire
- Régression logistique des moindres carrés partiels (PLS)
A défaut qu'on puisse trouver des macros, j'aimerais connaître l'avis de ceux qui ont l'habitude de programmer sous SAS pour savoir s'ils pensent réalisable l'adaptation de ces méthodologies sous macro SAS.

J'ai fouillé un peu sur google mais ormi pour les Arbres de décision que j'ai trouvé chez S. Tufféry, le reste nada. Au passage ça m'a permis de découvrir l'existance du module IML, savez vous son prix? là aussi j'ai trouvé plein d'infos mais pas le prix, de plus est-il aussi accessible que R (le site de SAS en fait référence) pour programmer?

En vous remerciant.
joyeux_lapin13 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/02/2011, 13h58   #2
Expert Confirmé
 
Avatar de olivier.decourt
 
Homme Olivier Decourt
Formateur en informatique
Inscription : avril 2008
Messages : 1 467
Détails du profil
Informations personnelles :
Nom : Homme Olivier Decourt
Âge : 34
Localisation : France

Informations professionnelles :
Activité : Formateur en informatique
Secteur : Conseil

Informations forums :
Inscription : avril 2008
Messages : 1 467
Points : 2 823
Points : 2 823
Bonjour.
La plupart des méthodes que tu cites sont disponibles dans certaines versions du module Enterprise Miner (à un coût exorbitant). Les programmer ne doit pas être des plus simples, sans quoi on aurait déjà des macros sur Internet ; à ma connaissance il n'y en a quasiment pas (à part %TREEDISC mais qui ne fait que des arbres CHAID, les plus simples et les moins intéressants, et quelques macros de réseaux de neurones et cartes de Kohonen).
Pour le prix d'IML : les tarifs chez SAS ne sont jamais publics. Et ils diffèrent très largement selon le type de machine sur laquelle SAS est installé (PC ou serveur, combien de processeurs, etc.).
Sur le langage IML : c'est spécial, quand même. Enfin pour un utilisateur de SAS. Je ne fais pas de R donc je n'ai pas d'avis comparatif. Mais j'ai travaillé sur de gros programmes IML et les soucis d'optimisation ne sont pas simples. Le code dépend beaucoup de la facilité de tes opérations à s'exprimer en langage mathématique.
Dans SAS 9.2 il y a quelques ponts entre le langage IML+ (dans lequel je ne me suis pas investi) et R. Mais je n'ai pas trop d'infos.

Enfin, "courbe ROC multiple" ; de quoi veux-tu parler ? De superposer des courbes ROC ? Là, tu peux trouver ici une macro %ROCCURVE qui dessine une courbe ROC, il suffit de la lancer plusieurs fois en récupérant la table créée dans un fichier de nom différent. Tu empiles ensuite tout dans la même table SAS et tu peux faire ton graphique. (En me relisant, je ne me trouve pas clair. J'espère que toi, si !)

Bon courage.
Olivier
olivier.decourt est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/02/2011, 14h24   #3
Membre habitué
 
Homme Julien
Ingénieur d'études / Biostatisticien
Inscription : décembre 2009
Messages : 304
Détails du profil
Informations personnelles :
Nom : Homme Julien
Localisation : France

Informations professionnelles :
Activité : Ingénieur d'études / Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : décembre 2009
Messages : 304
Points : 101
Points : 101
Merci pour ta réponse.

Concernant les courbes ROC multiples il s'agit plus ou moins d'une méthode d'analyse multivariée assez puissante (pas toujours la plus efficace) qui se base globalement sur la recherche de seuils optimaux au sein des différentes variables explicatives prisent en simultanée et déterminent les taux de spé et de sensibilité pour finalement sortir une règle de décision facilement applicable en fonction de ce seuil.

Voir: (Su JQ, Liu LS 1993)


Eventuellement si tu veux plus d'info sur cet outil je peux t'envoyer en MP la méthodologie décrite dans l'aide, c'est guère plus long que mon paragraphe car simplifié au maximum, mais l'idée est bien là.

Concernant mon problème je vais regarder du côté du 'pont' avec R, j'avais déjà croisé quelque lien dessus sans m'y interesser plus que ça. Je comptais demander à ma boîte de voir les prix de IML mais je pense que Enterprise Miner serait une bien meilleure attribution par conséquent, surtout que sur ce forum j'ai vu un lien qui permet de retrouver les procédures de EM pour les utiliser soit même sous l'interface SAS.

Encore merci pour ta réponse.
joyeux_lapin13 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 23/02/2011, 17h40   #4
Membre Expert
 
Avatar de MEGAMIND2
 
Homme Brice Beare
Paris
Inscription : janvier 2011
Messages : 956
Détails du profil
Informations personnelles :
Nom : Homme Brice Beare
Localisation : France, Paris (Île de France)

Informations professionnelles :
Activité : Paris

Informations forums :
Inscription : janvier 2011
Messages : 956
Points : 1 366
Points : 1 366
Salut,
J'ai une macro qui te permet de comparer la courbe ROC deux modèle. Si ça t'interessse!!
MEGAMIND2 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 25/02/2011, 12h29   #5
Membre habitué
 
Homme Julien
Ingénieur d'études / Biostatisticien
Inscription : décembre 2009
Messages : 304
Détails du profil
Informations personnelles :
Nom : Homme Julien
Localisation : France

Informations professionnelles :
Activité : Ingénieur d'études / Biostatisticien
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : décembre 2009
Messages : 304
Points : 101
Points : 101
Salut Megamind, comme je le disais à Olivier, les courbes ROC multiples n'ont rien à voir avec la superposition de plusieurs courbes ROC sur un même graphe (cf description sommaire que j'ai fait de cette méthode de modélisation statistique).

Je profite également de ce topic pour t'informer que j'ai bien reçu tes mp mais je n'arrive pas à te répondre en privée, apparemment tu aurais bloqué la reception de mp sur ta session...
joyeux_lapin13 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 13h06.


 
 
 
 
Partenaires

Hébergement Web