Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Statistiques et Data Mining Discussion :

Analyse de données : expliquer une variable à partir d'autres variables


Sujet :

Statistiques et Data Mining

  1. #1
    Nouveau Candidat au Club
    Analyse de données : expliquer une variable à partir d'autres variables
    Bonjour,

    Avant tout, j'espère avoir publier ma question dans la bonne discussion sinon je pourrais toujours la déplacer.

    J'ai à ma disposition des données numériques sous forme matricielle. Les variables sont au nombre de 20 (nuages détectés (0 ou 1), pluie(mm), ensoleillement, date, etc.).
    Je cherche à expliquer la variable nuage détecté par les autres variables/features.
    Je souhaiterai avoir une certaine règle de décision me donnant w, x, y et z tels que : si x<pluie<y et w<ensoleillement<z alors nuage détecté.

    Je ne sais pas comment m'y prendre sachant que certaines variables ne sont pas forcément importantes (j'ai pensé à faire une ACP). Aussi j'ai pensé à faire du Random Forest, même si je ne cherche pas à prédire, mais c'est plus dans l'idée de retracé son arbre de décision.

    Si vous avez de nouvelles idées je suis prenante,

    Merci,
    Yazaki

  2. #2
    Responsable Qt & Livres



    Citation Envoyé par yazaki Voir le message
    Aussi j'ai pensé à faire du Random Forest, même si je ne cherche pas à prédire, mais c'est plus dans l'idée de retracé son arbre de décision.
    Justement, je dirais le contraire : tu cherches à prédire si tu as un nuage. Maintenant, les forêts ne vont pas te donner de règle de cette forme-là, mais plutôt une série de telles règles à pondérer… Regarde plutôt du côté des arbres de décision, ça aura plus la forme que tu cherches.
    Vous souhaitez participer aux rubriques Qt ou PyQt (tutoriels, FAQ, traductions), HPC ? Contactez-moi par MP.

    Créer des applications graphiques en Python avec PyQt5
    Créer des applications avec Qt 5.

    Pas de question d'ordre technique par MP !

  3. #3
    Nouveau Candidat au Club
    Salut !

    Merci pour ta réponse, je suis donc passée par un arbre de décision mais me voilà avec un nouveau problème : je n'ai plus 1 variable à expliquer mais plutôt 3 variables à expliquer continues.

    J'ai découvert la méthode PLS (Partial Least Squares) qui théoriquement devrait résoudre mon soucis mais en pratique ça me fait de la prédiction …

    Je suis un peu perdue là ^^

    Merci,
    Yazaki

###raw>template_hook.ano_emploi###