Bonjour,
Je ne suis pas sûr que vous compreniez bien le fonctionnement d'un tel modèle.
En effet, il repose sur la résolution d'équations linéaires et doit donc avoir un nombre de degrés de liberté cohérent pour qu'il existe une unique solution. C'est pour cette raison que pour les variables qualitatives, on fixe une des modalités à zéro.
Le fait de créer une variable (codée en 0/1 j'imagine) pour chacune des modalités ne résoudra donc pas la problème.
Je pense qu'il faudrait que vous vous renseigniez sur la manière dont est construit l'indice de risque dont vous parlez.
Une piste peut-être, il arrive que dans certains cas, on "reconstruise" le coefficient pris comme référence comme étant l'opposé de la somme des autres coefficients.
Par exemple, avec LABOUR comme modalité de référence, cela donnerait :
coeff(LABOUR) = - coeff(TCS) - coeff(SEMIS DIRECT)
Après, c'est à vous de voir si c'est cohérent et également ce qui se fait dans votre domaine spécifique...
Bonne continuation
Cordialement,
A.D.
Partager