IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

régression logistiques données gigantesques


Sujet :

R

  1. #1
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2016
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2016
    Messages : 185
    Points : 51
    Points
    51
    Par défaut régression logistiques données gigantesques
    Bonjour à tous,
    j'ai une base de données de 200 GB constituée de 5 fichiers chacun de 40 GB
    je veux faire une régression logistique utilisant ces données est ce possible sur R ?
    est ce que c'est possible de regrouper les 5 fichiers dans une seule base ?
    Merci infiniment d'avance pou tous ceux qui puissent m'aider

  2. #2
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Bonjour Jeuneprincesse,

    Tout dépend de ta machine et si tu utilises les bons packages. Avec un ordinateur de bureau, il est peu probable que tu es des performances suffisantes pour réaliser cette étude à l'aide uniquement de la mémoire cache.

    Par contre il existe dans différents langages et en particulier sous R des packages pour des régressions sur de gros volumes de données comme bigglm. Dans mon cas j’utilise des solutions alternatives à R, comme Spark(qui supporte R).

    Je ne pourrais pas beaucoup t'aider plus.

    Au plaisir de te lire.

  3. #3
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2016
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2016
    Messages : 185
    Points : 51
    Points
    51
    Par défaut
    Bonsoir,
    merci et le fait de les mettre tous dans un seul fichier est ce que c'est possible ?
    ou bien je traie chaque fichier à part ?

  4. #4
    Membre éprouvé

    Homme Profil pro
    Cyber Security & AI
    Inscrit en
    Février 2009
    Messages
    506
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Cyber Security & AI

    Informations forums :
    Inscription : Février 2009
    Messages : 506
    Points : 1 189
    Points
    1 189
    Billets dans le blog
    2
    Par défaut
    Bonjour,

    De toutes les manières tu devras un moment agréger les données pour faire fonctionner ta régression. Il faut donc tout agrégé dans un même fichier ou dans une dataframe. Dans le cas de Spark les choses seraient différentes.

    Au plaisir de te lire.

  5. #5
    Membre du Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Avril 2016
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Âge : 33
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2016
    Messages : 185
    Points : 51
    Points
    51
    Par défaut
    Citation Envoyé par dev_ggy Voir le message
    Bonjour,

    De toutes les manières tu devras un moment agréger les données pour faire fonctionner ta régression. Il faut donc tout agrégé dans un même fichier ou dans une dataframe. Dans le cas de Spark les choses seraient différentes.

    Au plaisir de te lire.
    Bonjour,
    et pour la création d'un modèle prédictif quelconque comment seraient les choses
    Merci infiniment d'avance

Discussions similaires

  1. Régression logistique et dichotomisation des données (transformation binaire)
    Par fred0715 dans le forum Statistiques, Data Mining et Data Science
    Réponses: 2
    Dernier message: 25/07/2014, 15h49
  2. Régression logistique en données de panel
    Par goldenboy10 dans le forum SAS STAT
    Réponses: 8
    Dernier message: 06/08/2012, 09h21
  3. régression logistique et graphiques
    Par ebongue dans le forum SAS STAT
    Réponses: 4
    Dernier message: 16/06/2009, 13h54
  4. régression logistique SAS
    Par sandrine_87 dans le forum SAS STAT
    Réponses: 1
    Dernier message: 09/02/2009, 21h01
  5. Réponses: 1
    Dernier message: 17/04/2007, 16h47

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo