IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Régression logistique Aide


Sujet :

R

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2016
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2016
    Messages : 4
    Par défaut Régression logistique Aide
    Bonjour,

    Je suis nouvelle sur le forum et je mets beaucoup d'espoirs dans votre aide. Je suis débutante sur R, je fais partie du monde de la primatologie et dans le cadre de mon master, j'ai besoin de tester une nouvelle méthode afin de déterminer la vitesse de dégradation des nids de Gorilles.

    Mon jeu de données est en pièce jointe.
    Il s'agit d'effectuer des marquages de nids, et revenir ici 120 jours après les premiers marquages et marquer simplement la présence ou l'absence des nids.
    Un article scientifique décrit cette méthode pour calculer, grâce a une régression logistique, la vitesse de dégradation de signes des populations.

    Donc mon jeux de données est vitdeg2.
    La régression se présente donc par la durée de suivi des nids, et la présence ou absence au bout des 3 mois.
    J'ai réalisé la régression grâce à la commande glm(), mon script est en pièce jointe. Les plots obtenus pour la régression logistique sont aussi en pièces jointes.

    Il suffit maintenant de comprendre tout ça... Je n'arrive pas à interpréter ces résultats et à sortir une durée de dégradation des nids...

    Quelqu'un aurait une idée..?

    Merci d'avance !
    Images attachées Images attachées  
    Images attachées Images attachées
    Fichiers attachés Fichiers attachés

  2. #2
    Membre émérite
    Homme Profil pro
    Chercheur
    Inscrit en
    Décembre 2015
    Messages
    327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 327
    Par défaut
    Si tu nous disais ce que signifie x et r dans ton script, ce serait plus facile pour t'aider

  3. #3
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2016
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2016
    Messages : 4
    Par défaut Milles excuses.
    Bonjour,

    r est le modèle de la regression logistique, et x est la durée du suivi, en d'autre terme le temps qui sépare le marquage du nids et la revisites de tout les nids.

    ce n'est pas le bon script que j'ai joint je mets le bon.

    En espérant que vous puissiez m'aider.

    Merci.

    Angèle
    Fichiers attachés Fichiers attachés

  4. #4
    Membre émérite
    Homme Profil pro
    Chercheur
    Inscrit en
    Décembre 2015
    Messages
    327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 327
    Par défaut
    1) Remarque par rapport à la syntaxe de R : inutile de créer des variables intermédiaires x et y. Il suffit d'écrire :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    r <- glm( presence.absence ~ suivi, data=vitdeg2, family=binomial)
    2) Remarque par rapport à l'analyse : tu as explicitement la durée de survie et aucune donnée censurée puisque tu as les survies pour tous les nids. Que tu prennes toutes les informations ou que tu te limites à une période d'observation de 3 mois, dans ce cas, les survies de plus de trois mois sont des données censurées, une analyse de survie est plus adaptée, d'autant que la signification de la variable presence.absence n'est pas homogène dans le fichier. En effet, elle vaut par exemple 0 pour un suivi de 120 jours et une survie de 98 jours et 1 pour la même survie quand le suivi est de 87 jours.

    3) Interprétation du résultat de glm. Le modèle logistique est : log( Pr( Y=1) / Pr( Y=0)) = b x. D'où Pr( Y=1) = exp( b x) / (1 + exp( b x)). Donc :
    b = 0, les deux cas sont probables en fonction de x et Y est donc indépendant de x ;
    b > 0, Y croit en fonction de x
    b < 0, Y décroit en fonction de x.

    4) Compte-tenu des points 2 et 3, l'analyse de survie donne une durée de vie médiane des nids tandis que l'analyse logistique donne un taux de présence des nids après la dizaines de valeurs du suivi qui devraient alors être considérées comme des niveaux d'un facteur plus que comme des variables numériques. Il est très hasardeux de vouloir interpoler le taux de présence entre ces valeurs et de considérer que la valeur du coefficient suivi de glm est représentatif d'un taux de disparition des nids en fonction du temps.

  5. #5
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2016
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2016
    Messages : 4
    Par défaut
    Bonjour,

    Merci beaucoup pour votre explication,

    Concernant le point 2, le jeu de données est destiné à tester la méthode d'analyse, les durées de survie obtenues ne sont normalement pas obtenus avec la méthode. c'est pour cela que je ne peux pas les utiliser. La variable n'est pas homogène, puisque la méthode consiste à marquer des nids durant 3 mois, soit un nids marqué à 3 jours n'aura une durée de suivis que de 127 jours. Alors il est possible qu'un nid marqué en fin des 3mois soit encore présent lors de la revisite qui est au bout de 120 jours après les premiers marquages. Au bout des 120 jours nous avons donc des nids jeunes et plus vieux si je puis dire. mais dans les données actuelles nous avons en effet les durée de survie des nids afin de vérifier la méthode mais normalement avec la méthode testé nous cherchons a obtenir une valeur de durée de survie moyenne.

    Donc d'après ce que je comprend, si le coefficient est de -0,048383 , soit 0,048383% des nids disparaissent en 1jours?

  6. #6
    Membre émérite
    Homme Profil pro
    Chercheur
    Inscrit en
    Décembre 2015
    Messages
    327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 327
    Par défaut
    "Concernant le point 2, le jeu de données est destiné à tester la méthode d'analyse, les durées de survie obtenues ne sont normalement pas obtenus avec la méthode." Désolé je ne comprends absolument pas ce que tu veux dire.

    Tes données comportent 4 informations (colonnes) qu'il faut détailler :
    - construction qui est une date ; est-ce la date de construction du nid ou de sa première observation ?
    - durée suivi : le nid a-t-il été vu pendant ce nombre de jours après la date de 'construction' ou a-t-il disparu au bout de cette durée ?
    - type : type de nid ?
    - date de visite de contrôle qui d'ailleurs est une constante.

    A partir de cela que cherches-tu ?

    Si 'construction' est la date de construction du nid, il n'y a pas de données censurées à gauche ; si c'est la date de première observation, il peut s'agir de données censurées à gauche et tu dois en tenir compte dans ton analyse. Il existe différentes approches pour cela.
    'durée suivi' si le nid a été vu durant cette période et qu'il existe après, au-delà (par exemple pour la ligne 18, au-delà des 131 jours après le 3/11/2011, ce sont des données censurées à droite, sinon, si c'est le nombre de jours pendant lesquels le nid a existé après la date de 'construction', il n'y a pas de données censurées à droite à partir de la variable 'suivi' mais il y en a à partir de la variable 'date de visite'.

    De plus, tu fais l'hypothèse que la durée du nid est indépendant du type de nid. Est-ce justifié ?

    "Donc d'après ce que je comprend, si le coefficient est de -0,048383 , soit 0,048383% des nids disparaissent en 1jours?" Le coefficient ne veut rien dire puisque les nids peuvent disparaitre aussi bien la veille de la date de visite que quelques jours à plusieurs mois avant, comme cela aussi peut de passer quelques jours après ou plusieurs mois après. Tu as une information plus précise qui est le suivi pour cela et je ne suis pas persuadé que le modèle sous-jacent à l'analyse logistique est correct.

    Ci joint, superposé en noir à tes graphiques, le pourcentage de nid dont la durée de survie est supérieure à un nombre donné de jours. On voit parfaitement que les deux courbes (pointillés bleus et courbe en noir) ne se superposent absolument pas.Nom : vitdeg2.png
Affichages : 243
Taille : 6,4 Ko

  7. #7
    Futur Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Mai 2016
    Messages
    4
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France, Vienne (Poitou Charente)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2016
    Messages : 4
    Par défaut
    Bonjour,

    Je vais vous expliquer plus largement, je suis actuellement en train de récolter les données afin de calculer la vitesse de dégradation des nids sur les Bonobos, cependant j'ai besoin de prouver que cette méthode (régression logistique) marche alors j'utilise des données déjà récoltées sur les Gorilles, dans ces données le temps de survie des nids est donné, mais il faut considérer que nous n'avons pas accès à cela car la méthode que j'utilise sur les bonobos consiste à calculer la vitesse de dégradation du nid (soit le temps de survie du nid) chez les bonobos.

    La date de construction est la date de construction des nids par les gorilles. Il y a dans cette méthode seulement deux visites des nids. Un marquage à la date de construction et un second au bout de 120 jours après le premier marquage. La colonne durée de survie ne doit donc pas entrer dans l'analyse. Le type de nid pourrait être inclus dans l'analyse mais j'aimerais trouver une vitesse de dégradation (soit une durée de survie moyenne des nids avec cette méthode avant)...

    La date de visite de contrôle correspond à la seconde visite, soit 120 jours après la première visite, soit après le premier marquage, soit la première date de construction.
    Dans les données actuellement récoltées, j'obtiendrais une date de construction, une date de 2nd visite, après 3 mois à partir de la première date, et un facteur absence/présence, et quelques variables propres à la forêt et au nid en lui-même, mais en aucun cas une durée de survie du nid.

Discussions similaires

  1. Réponses: 1
    Dernier message: 26/07/2012, 18h07
  2. Régression logistique avec intéractions
    Par joyeux_lapin13 dans le forum SAS STAT
    Réponses: 1
    Dernier message: 27/04/2010, 11h43
  3. régression logistique et graphiques
    Par ebongue dans le forum SAS STAT
    Réponses: 4
    Dernier message: 16/06/2009, 13h54
  4. régression logistique SAS
    Par sandrine_87 dans le forum SAS STAT
    Réponses: 1
    Dernier message: 09/02/2009, 21h01
  5. Réponses: 1
    Dernier message: 17/04/2007, 16h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo