IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Mathématiques Discussion :

Regression non linéaire


Sujet :

Mathématiques

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Août 2010
    Messages
    25
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 25
    Par défaut Regression non linéaire
    Bonjour à tous,

    J'ai un problème du type régression non linéaire avec une particularité supplémentaire : je ne dispose pas de la variable exogène (y) pour toutes les données mais pour des groupes de données. Je m'explique:

    Mon modèle est du type: y_i = somme sur j (f(X_ij, paramètres))

    Pour le moment je calcule la somme du carré des résidus

    S = somme sur i { y_i - somme sur j (f(X_ij, paramètres)) }²

    Pour le moment, je résous cela sans subtilité avec une fonction d'optimisation (recuit simulé, ou une recherche locale + multistart) mais je me demande s'il n'y a pas mieux...

    Qu'en pensez vous?

    Merci.

  2. #2
    Membre Expert Avatar de Nemerle
    Inscrit en
    Octobre 2003
    Messages
    1 106
    Détails du profil
    Informations personnelles :
    Âge : 55

    Informations forums :
    Inscription : Octobre 2003
    Messages : 1 106
    Par défaut
    réseau neuronal?

  3. #3
    Membre averti
    Profil pro
    Inscrit en
    Août 2010
    Messages
    25
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 25
    Par défaut
    Non, non... Calibrage d'un modèle économétrique

  4. #4
    Membre Expert Avatar de Nemerle
    Inscrit en
    Octobre 2003
    Messages
    1 106
    Détails du profil
    Informations personnelles :
    Âge : 55

    Informations forums :
    Inscription : Octobre 2003
    Messages : 1 106
    Par défaut
    je proposai un réseau neuronal comme modèle de régression non linéaire.

  5. #5
    Membre Expert
    Homme Profil pro
    Chercheur
    Inscrit en
    Mars 2010
    Messages
    1 218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Mars 2010
    Messages : 1 218
    Par défaut
    Bonjour,

    Citation Envoyé par sfiliste Voir le message
    J'ai un problème du type régression non linéaire avec une particularité supplémentaire : je ne dispose pas de la variable exogène (y) pour toutes les données mais pour des groupes de données.
    Si j'ai bien compris, tu te trouves typiquement dans un problème d'apprentissage semi-supervisé (en l'occurence une régression semi-supervisée).
    Tu devrais jeter un oeil de ce côté-là.

  6. #6
    Membre averti
    Profil pro
    Inscrit en
    Août 2010
    Messages
    25
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 25
    Par défaut
    Bonjour,

    Pourrais-je en savoir un peu plus sur ces deux notions?

    Pour bien préciser mon problème:

    - J'ai des variables prédictives X1, ... Xp (p variables explicatives) qui sont des vecteurs de n observations chacune

    Si j'avais pour chacune de ces observations la valeur Y, je ferais un modèle "classique" de regression non linéaire avec Y = f(X1, ... , Xp ; paramètres) où le but est d'estimer ces paramètres.

    Ici je n'ai que les valeurs Y pour des groupes (disjoints) de ces observations.

    ----------------
    Exemple (fictif!).

    Supposons que je cherche à expliquer le salaire d'un individu à partir de son expérience (en mois) et de sa durée d'études (en mois)

    On aurait par exemple les données suivantes:

    N° observation//Expérience//Durée_etudes
    1 11 39
    2 286 15
    3 100 12
    4 109 48
    5 337 9
    6 334 43
    7 16 26
    8 76 5
    9 82 17
    10 188 42
    11 76 60
    12 330 4
    13 398 9
    14 351 49
    15 196 18

    Et supposons que j'ai les salaires suivants (uniquement pour des groupes):

    1+2+3 72421
    4+5 39134
    6 50056
    7+8 97253
    9+10+11+12 162467
    13+14+15 84504

    On cherche à calibrer un modèle non linéaire (volontairement complexe) du type salaire = K * expérience^alpha + durée_études^beta

    Merci.

  7. #7
    Membre très actif
    Profil pro
    chercheur
    Inscrit en
    Avril 2004
    Messages
    830
    Détails du profil
    Informations personnelles :
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : chercheur

    Informations forums :
    Inscription : Avril 2004
    Messages : 830
    Par défaut
    Je ne vois pas où est le problème. Tu as 6 observations pour lesquelles tu peux écrire une fonction des 3 inconnues alpha et beta et K. Comparer 39134 à
    K * (expérience[4]^alpha + durée_études[4]^beta + expérience[5]^alpha + durée_études[5]^beta) etc.
    C'est un pb de régression élémentaire.

  8. #8
    Membre Expert
    Homme Profil pro
    Chercheur
    Inscrit en
    Mars 2010
    Messages
    1 218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Mars 2010
    Messages : 1 218
    Par défaut
    Bonjour,

    j'avais mal compris ton problème.
    Il est beaucoup plus compliqué que prévu.
    Es-tu sûr de ne pas pouvoir avoir d'autres données?
    En bricolant, tu pourras faire un modèle mais peu précis.
    Et dans ce cas, tu devras faire des hypothèses simplificatrices (tu es dans un problème de valeurs manquantes).

    En première approche naïve, tu peux partir du principe que le salaire moyen dans chaque groupe est le salaire de l'individu "barycentre".

    1+2+3 72421 => salaire moyen = 72421 / 3
    individu moyen => vecteur des moyennes des variables explicatives des individus 1, 2 et 3.

    Ensuite, tu fais une régression avec les individus moyens de chaque groupe.
    Puis, tu prédis les salaires de tes individus de départ.

    Si après test, tes résultats te conviennent, on pourra améliorer un tout petit peu l'algorithme en ajoutant des pondérations.

    Ceci dit, je ne vois pas comment tu vas pouvoir valider ton modèle...

  9. #9
    Membre Expert
    Homme Profil pro
    Chercheur
    Inscrit en
    Mars 2010
    Messages
    1 218
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Mars 2010
    Messages : 1 218
    Par défaut
    Citation Envoyé par Nebulix Voir le message
    Je ne vois pas où est le problème. Tu as 6 observations pour lesquelles tu peux écrire une fonction des 3 inconnues alpha et beta et K.
    Non, justement, il n'a pas les 6 individus (il manque les variables explicatives).

  10. #10
    Membre averti
    Profil pro
    Inscrit en
    Août 2010
    Messages
    25
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Août 2010
    Messages : 25
    Par défaut
    Bonjour,

    Mon problème est en effet assez complexe!

    Pour la validation du modèle, il n'y a pas de problème : je calcule les indicateurs classiques (R² ; plage des coefficients par bootstrap ; etc.)

    A vrai dire, pour l'estimation, je n'en avais pas jusqu'à maintenant car j'estimais les paramètres de mon modèle en minimisant la somme du carré des écarts, et via un optimiser type recuit simulé.

    Mais j'ai beaucoup plus de données maintenant (environ 5000 Y et 50000X, X étant de dimension environ 10) et la fonction d'optimisation met des jours à tourner...

  11. #11
    Membre très actif
    Profil pro
    chercheur
    Inscrit en
    Avril 2004
    Messages
    830
    Détails du profil
    Informations personnelles :
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : chercheur

    Informations forums :
    Inscription : Avril 2004
    Messages : 830
    Par défaut
    Citation Envoyé par Aleph69 Voir le message
    Non, justement, il n'a pas les 6 individus (il manque les variables explicatives).
    Par habitude, j'appelle observations les données que l'on veut comparer à un modèle : les 6 nombres du 2e paragraphe.
    Pour chacune de ces observations, il peut calculer une valeur théorique avec trois paramètres. Le pb est un problème de moindres carrés parfaitement banal.
    (Jouer un peu sur les pondérations ne devrait pas changer grand chose)

    Je ne sais pas ce qu'est une "variable explicative". Ici çà ne fait qu'obscurcir inutilement un problème tout simple.

Discussions similaires

  1. regression non linéaire
    Par romainmill dans le forum Calcul scientifique
    Réponses: 24
    Dernier message: 11/03/2014, 09h54
  2. regression non linéaire
    Par thtghgh dans le forum Mathématiques
    Réponses: 8
    Dernier message: 16/09/2011, 14h49
  3. Regression non linéaire - Prédicteurs
    Par thtghgh dans le forum SAS STAT
    Réponses: 11
    Dernier message: 14/11/2010, 13h04
  4. Regression non linéaire
    Par DooX4EvEr dans le forum MATLAB
    Réponses: 0
    Dernier message: 11/08/2010, 13h01
  5. Loi de King - Regression non linéaire
    Par damienw dans le forum Mathématiques
    Réponses: 6
    Dernier message: 14/05/2008, 21h32

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo