IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Normalisation de Box-Cox


Sujet :

R

  1. #1
    Membre habitué
    Homme Profil pro
    Ingénieur d'études / Biostatisticien
    Inscrit en
    Décembre 2009
    Messages
    354
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur d'études / Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Décembre 2009
    Messages : 354
    Points : 194
    Points
    194
    Par défaut Normalisation de Box-Cox
    Bonjour, je dispose d'un logiciel professionnel qui permet d'appliquer la normalisation de Box-Cox automatique pour enchaîner sur des analyses multivariées nécessitant que les variables explicatives suivent une loi normale.

    A coté de ça, je cherche à retrouver les mêmes résultats que ce logiciel mais avec SAS (proc TRANSREG). Mais voilà où ça coince, j'obtiens globalement les même résultats à 0.01 près mais pour certaines variables, j'obtiens un écart un peu plus important (pour le moment soit la différence est de 0.01 soit de 0.03...).

    Je viens sur le forum R dans l'espoir de trouver une personne qui a un programme R bien rôdé pour faire ce type de normalisation, lui demander s'il peut le faire tourner sur le jeu de données ci-dessous et me dire quel lambda de Box-Cox sa fonction lui renvoie.

    (séparateur = tabulation = "\t")
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
    106
    107
    108
    109
    110
    111
    112
    113
    114
    115
    116
    117
    118
    119
    120
    121
    122
    123
    124
    125
    126
    127
    128
    129
    130
    131
    132
    133
    134
    135
    136
    137
    138
    139
    140
    141
    142
    143
    144
    145
    146
    147
    148
    149
    150
    151
    152
    153
    154
    155
    156
    157
    158
    159
    160
    161
    162
    163
    164
    165
    166
    167
    168
    169
    170
    171
    172
    173
    174
    175
    176
    177
    178
    179
    180
    181
    182
    183
    184
    185
    186
    187
    188
    189
    190
    191
    192
    193
    194
    195
    196
    197
    198
    199
    200
    201
    202
    203
    204
    205
    206
    207
    208
    209
    210
    211
    212
    213
    214
    215
    216
    217
    218
    219
    220
    221
    222
    223
    224
    225
    226
    227
    228
    229
    230
     
    Y	X
    1	53.4
    2	29.9
    2	53.4
    1	37.3
    1	28.8
    2	34.4
    1	51.0
    2	52.3
    2	25.1
    2	13.1
    1	51.1
    2	39.0
    1	26.1
    2	35.6
    1	45.3
    1	46.1
    2	38.3
    1	53.1
    1	27.9
    2	45.6
    2	27.7
    1	41.1
    2	44.5
    1	10.6
    1	30.6
    2	18.2
    1	29.2
    1	31.3
    2	30.7
    1	26.7
    1	37.4
    2	15.6
    2	51.9
    2	45.4
    2	31.6
    1	25.4
    1	24.3
    2	22.7
    1	19.2
    2	30.4
    1	18.7
    2	30.6
    1	15.7
    2	39.9
    2	26.9
    2	32.6
    1	29.1
    1	19.1
    2	20.9
    1	27.8
    2	12.6
    2	17.6
    2	35.9
    2	21.3
    1	13.7
    1	13.7
    2	41.8
    1	16.5
    2	16.6
    1	23.9
    2	13.5
    1	53.6
    2	41.5
    1	25.7
    1	22.1
    1	24.0
    1	15.8
    1	45.3
    2	32.3
    1	20.8
    1	45.3
    1	44.6
    2	22.5
    1	23.2
    1	28.0
    1	40.7
    1	40.0
    2	42.7
    2	34.2
    1	31.2
    1	41.1
    1	24.6
    1	36.4
    1	29.3
    1	23.5
    1	42.8
    1	26.1
    2	30.5
    1	22.3
    1	17.3
    1	40.5
    1	28.7
    1	21.9
    1	25.9
    1	25.4
    1	19.0
    1	20.1
    2	30.0
    1	12.2
    1	25.4
    1	32.7
    1	23.8
    1	30.5
    2	18.2
    2	19.8
    1	16.5
    1	32.0
    1	62.7
    1	30.3
    2	42.7
    1	30.2
    2	27.0
    2	35.7
    1	31.5
    2	77.5
    1	37.0
    2	31.5
    1	49.1
    2	42.6
    2	20.4
    2	35.1
    1	29.7
    1	50.6
    1	40.4
    1	28.1
    2	44.9
    2	54.0
    1	23.4
    1	36.3
    1	22.3
    2	23.4
    1	36.2
    1	25.6
    1	34.0
    1	41.9
    2	14.6
    1	10.5
    1	28.7
    1	24.2
    2	27.7
    2	17.6
    1	31.7
    1	25.9
    1	34.1
    2	25.7
    1	31.9
    2	23.7
    1	33.1
    1	19.8
    1	34.5
    1	15.6
    1	13.2
    1	26.9
    1	17.7
    1	12.2
    1	25.0
    1	18.6
    1	20.1
    1	29.8
    1	36.6
    1	39.4
    1	38.5
    1	23.8
    1	32.3
    1	30.1
    1	26.0
    1	36.7
    2	17.2
    1	14.5
    2	15.7
    1	36.0
    1	14.0
    1	3.6
    1	29.2
    2	33.5
    1	7.7
    2	32.8
    1	14.1
    1	18.2
    1	31.0
    1	19.6
    2	15.2
    1	12.8
    2	25.5
    1	15.3
    1	16.4
    2	33.1
    2	32.0
    2	20.1
    2	24.9
    1	18.6
    2	36.4
    2	28.4
    1	14.2
    1	13.9
    1	20.0
    2	23.0
    2	37.6
    1	21.4
    1	36.1
    2	22.7
    1	24.4
    1	10.6
    2	54.0
    2	29.5
    1	6.8
    1	10.0
    1	13.5
    1	13.8
    1	25.4
    1	9.8
    2	5.6
    1	8.0
    2	113.8
    1	20.6
    1	12.9
    1	23.3
    1	35.0
    1	8.0
    1	7.1
    1	14.5
    1	13.4
    1	30.3
    1	10.8
    1	19.9
    2	13.4
    2	18.3
    2	8.7

    J'aurais volontier demandé une fonction R mais mon souci c'est que j'aimerais m'affranchir de tout mauvais paramétrage par méconnaissance de la fonction.

    Le paramètre lambda_SAS = 0.37
    lambda_AUTRE = 0.34

    En vous remerciant d'avance.

  2. #2
    Inactif  


    Homme Profil pro
    Inscrit en
    Novembre 2008
    Messages
    5 288
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Secteur : Santé

    Informations forums :
    Inscription : Novembre 2008
    Messages : 5 288
    Points : 15 620
    Points
    15 620
    Par défaut
    Bon, habituellement, il est préférable de faire soi même les analyses, le forum est fait pour entraider, pas faire le travail à la place des autres...
    Mais ce soir, je suis de bonne humeur

    Pour la doc, perso j'aime bien de tutoriel de l'auteur de tanagra : http://eric.univ-lyon2.fr/~ricco/cou..._Normalite.pdf (chapitre 4 pour la transformation box-cox). Tu y trouveras aussi un exemple d'analyse avec tanagra

    Pour R, il suffit d'utiliser la fonction boxcox du paquet MASS : http://stat.ethz.ch/R-manual/R-patch...ml/boxcox.html
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    boxcox(d$X~d$Y, lambda = seq(0, 0.7, length = 100))


    Le code suivant :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    lambda <- boxcox(d$X~d$Y, lambda = seq(0, 0.7, length = 10000), plotit=F)
    lambda$x[which.max(lambda$y)]
    donne un lambda de 0.34303.
    Ensuite, tout dépend du modèle utilisé dans SAS. Il faudrait voir la documentation en détail pour connaître les paramètres par défaut.
    Images attachées Images attachées  

  3. #3
    Membre habitué
    Homme Profil pro
    Ingénieur d'études / Biostatisticien
    Inscrit en
    Décembre 2009
    Messages
    354
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur d'études / Biostatisticien
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Décembre 2009
    Messages : 354
    Points : 194
    Points
    194
    Par défaut
    Salut et merci de ta réponse, je te rassure je suis pas du genre à demander à ce qu'on fasse le travail pour moi juste que je suis depuis 2 semaines sur ce problème et je sais plus quoi faire pour retrouver la même chose avec mon logiciel pro et SAS.

    Donc déjà je m'étais trompé, en effet SAS me renvoi 0.34 et non 0.37, j'ai inversé.

    Bon ça me conforte dans SAS mais pas dans mon logiciel pro que ma boîte utilise depuis des lustres...

    Bref, pas rassurant tout ça...

    Encore merci pour ton coup d'pouce!

  4. #4
    Inactif  


    Homme Profil pro
    Inscrit en
    Novembre 2008
    Messages
    5 288
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Secteur : Santé

    Informations forums :
    Inscription : Novembre 2008
    Messages : 5 288
    Points : 15 620
    Points
    15 620
    Par défaut
    Ce n'est pas étonnant, pour des raisons de facilité d'utilisation, beaucoup de logiciels d'analyse ne donnent pas accès à tous les paramètres des fonctions et on a parfois des résultats différents, sans qu'il soit possible d'expliquer cette différence. Il faut poser la question au support logiciel.
    Lecture intéressante aussi : l'auteur de tanagra (celui qui a écrit le pdf sur les tests de normalité) réalise des comparaisons entre une même méthode implémentée dans différents logiciels, c'est très instructif.

    Bonne continuation

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Normalisation de Box-Cox avec la PROC TRANSREG
    Par joyeux_lapin13 dans le forum SAS STAT
    Réponses: 2
    Dernier message: 12/02/2011, 21h27
  2. Paramètres LMS (Box-Cox)
    Par archonte dans le forum Mathématiques
    Réponses: 5
    Dernier message: 14/09/2007, 18h31
  3. Pop-up d'une dialog box a partir d'un bouton
    Par bobbyjack dans le forum MFC
    Réponses: 21
    Dernier message: 13/09/2005, 15h32
  4. Insertion dialog box dans feuille SDI
    Par Tom Joad dans le forum MFC
    Réponses: 3
    Dernier message: 12/04/2004, 00h04
  5. question sur les message box !
    Par krown dans le forum Langage
    Réponses: 7
    Dernier message: 02/08/2002, 16h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo