IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Manipulation de données binaire venant d'excel sur R


Sujet :

R

  1. #1
    Membre averti
    Femme Profil pro
    etudiante
    Inscrit en
    Avril 2017
    Messages
    27
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 29
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : etudiante
    Secteur : High Tech - Matériel informatique

    Informations forums :
    Inscription : Avril 2017
    Messages : 27
    Par défaut Manipulation de données binaire venant d'excel sur R
    Bonjour a tous

    Dans le cadre de mon memoire sur les data scientist , j'ai réaliser une base de données sur Excel avec l'ensemble des competences requises pour un data scientist provenant d'offres d'emploi.
    Selon les offres d'emploi, si on mentionne la competences je met 1 sinon je met 0. il y a a peu pres 100 offres d'emploi repertorier sur mon fichier excel.
    Je dois realiser un ensemble de statistique descriptive sur mes donnees en utilisant R
    cependant etant debutante sur R je n'ai reussi qu'a afficher le poucentage de fois ou apparait chaque competences
    Pourriez vous m'aidez a savoir quel autre type de stat je dois faire sur des donnees binaire (ce que je trouve sur le net n'est pas tres clair).
    J'aimerai bien faire une regression lineaire, ou un ggplot ou meme un regroupement (cluster)
    Je vous met en piece jointe mon fichier excel ainsi qu'une capture d'ecran de ce que j'ai reussi a faire sur R
    Toutes reponse est la bienvenue !!
    merci a tous
    Images attachées Images attachées  
    Fichiers attachés Fichiers attachés

  2. #2
    Membre émérite
    Homme Profil pro
    Chercheur
    Inscrit en
    Décembre 2015
    Messages
    327
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Chercheur
    Secteur : Enseignement

    Informations forums :
    Inscription : Décembre 2015
    Messages : 327
    Par défaut
    Tu ne peux pas faire de régression linéaire sur des données binaires, il faut faire une régression logistique. Sous R, tu dois utiliser la fonction glm avec comme valeur du paramètres family, binomial (voir par exemple https://perso.univ-rennes2.fr/system...stique_web.pdf) mais il faut définir quelle est la variable à analyser, ce qui ne me parait pas très clair. Je pense que tu dois abandonner cette idée. Par contre, tu peux utiliser une analyse des correspondances (fonction CA du package FactoMineR) si tu considères que les compétences ne sont pas organisées par groupes, c'est-à-dire que tu mets par exemple au même plan l'utilisation des techniques d'IA, de statistiques inférentielles ou de gestion/structuration des données. Par contre si tu ajoutes ce niveau de structuration, une technique de type analyse par facteurs multiples (multiple factor analysis, MFA dans le package FactoMineR) pourrait être intéressante.

    N.B. Par sécurité, définis toutes tes variables comme étant des facteurs.

Discussions similaires

  1. [XL-2010] VBA excel - envoyer des données d'un fichier excel sur plusieurs fichiers words
    Par Marc31 dans le forum Macros et VBA Excel
    Réponses: 3
    Dernier message: 08/08/2011, 13h53
  2. Réponses: 1
    Dernier message: 17/01/2010, 17h59
  3. Réponses: 4
    Dernier message: 08/01/2009, 15h01
  4. manipulation de données binaires
    Par zobsystem dans le forum Langage
    Réponses: 1
    Dernier message: 22/03/2007, 01h49
  5. Manipulation de données binaires
    Par Defre87 dans le forum Général Python
    Réponses: 3
    Dernier message: 28/09/2005, 16h16

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo