IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

R Discussion :

Probleme avec doMC (calcul sur plusieurs cores)


Sujet :

R

  1. #1
    Membre régulier
    Inscrit en
    Juin 2009
    Messages
    88
    Détails du profil
    Informations forums :
    Inscription : Juin 2009
    Messages : 88
    Points : 76
    Points
    76
    Par défaut Probleme avec doMC (calcul sur plusieurs cores)
    Bonjour,

    Je commence à me pencher sur la parallélisation de calcul sur plusieurs cores.

    L'exemple suivant marche très bien.
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
     
    library(doMC)
    registerDoMC()
     
    x <- iris[which(iris[, 5] != "setosa"), c(1, 5)]
    trials <- 10000
    ptime <- system.time({
      r <- foreach(icount(trials), .combine = cbind) %dopar% {
        ind <- sample(100, 100, replace = TRUE)
        result1 <- glm(x[ind, 2] ~ x[ind, 1], family = binomial(logit))
        coefficients(result1)
        }
      })[3]
    ptime
    Avec le moteur d'activité je peux voir que les deux cores sont utilisés.
    Par contre avec cet autre exemple :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
     
    library(doMC)
    registerDoMC()
    trials <- 30000
    ptime <- system.time({
             x <- foreach(icount(trials)) %dopar% sqrt(i)
    })[3]
    ptime
    Il n'y a qu'un seul core qui travaille . Alors que je voudrais faire travailler les deux.

    J'espère que quelqu'un a un peu d'expérience sur ce sujet.

    Cordialement.

  2. #2
    Membre averti
    Femme Profil pro
    Inscrit en
    Septembre 2009
    Messages
    272
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : France

    Informations forums :
    Inscription : Septembre 2009
    Messages : 272
    Points : 417
    Points
    417
    Par défaut
    Bonsoir,
    il y a eu une discussion sur le forum à ce sujet: http://www.developpez.net/forums/d10...rice-resultat/

    En espérant que cela vous aide un peu...

    Bonne continuation

  3. #3
    Membre confirmé
    Homme Profil pro
    MCU
    Inscrit en
    Juillet 2010
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : MCU
    Secteur : Santé

    Informations forums :
    Inscription : Juillet 2010
    Messages : 185
    Points : 486
    Points
    486
    Par défaut
    Bonjour,

    Sur la dernière version de R (2.14), il y a le package parallel dans la distribution de base et notamment la fonction mclapply. Ce n'est pas vraiment du calcul parallèle, plutôt du calcul distribué. Elle s'utilise comme lapply sauf qu'on précise le nombre de coeur à utiliser.

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    library(parallel)
    ?mclapply
     
    x <- iris[which(iris[, 5] != "setosa"), c(1, 5)]
    test <- mclapply(1:1000, function() {
     ind <- sample(100, 100, replace = TRUE)
     result1 <- glm(x[ind, 2] ~ x[ind, 1], family = binomial(logit))
     return(coefficients(result1))
    }, 
    mc.cores=4)
    HTH

    Vincent

  4. #4
    Membre régulier
    Inscrit en
    Juin 2009
    Messages
    88
    Détails du profil
    Informations forums :
    Inscription : Juin 2009
    Messages : 88
    Points : 76
    Points
    76
    Par défaut
    Bonjour,

    Merci pour ces indications. Je vais me pencher sur le package parallel.
    Cependant en utilisant directement le code donné
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
     
    library(parallel)
    ?mclapply
     
    x <- iris[which(iris[, 5] != "setosa"), c(1, 5)]
    test <- mclapply(1:1000, function() {
     ind <- sample(100, 100, replace = TRUE)
     result1 <- glm(x[ind, 2] ~ x[ind, 1], family = binomial(logit))
     return(coefficients(result1))
    }, 
    mc.cores=4)
    j'ai le message d'erreur suivant
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
     
    Message d'avis :
    In mclapply(1:1000, function() { :
      all scheduled cores encountered errors in user code
    Il manque peut etre quelque chose dans le code. ???

  5. #5
    Membre confirmé
    Homme Profil pro
    MCU
    Inscrit en
    Juillet 2010
    Messages
    185
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : MCU
    Secteur : Santé

    Informations forums :
    Inscription : Juillet 2010
    Messages : 185
    Points : 486
    Points
    486
    Par défaut
    Bonsoir,

    Désolé j'ai pas testé le code avant de poster. Il faut juste donner un argument à la fonction dans mclapply et non mettre des parenthèses vides et ça marche.

    Vincent

  6. #6
    Membre régulier
    Inscrit en
    Juin 2009
    Messages
    88
    Détails du profil
    Informations forums :
    Inscription : Juin 2009
    Messages : 88
    Points : 76
    Points
    76
    Par défaut
    J'ai corrigé le code et maintenant ça marche :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
     
    library(parallel)
    ?mclapply
     
    ptime <- system.time({
    x <- iris[which(iris[, 5] != "setosa"), c(1, 5)]
    test <- mclapply(1:10000, function(glm) {
      ind <- sample(100, 100, replace = TRUE)
      result1 <- glm(x[ind, 2] ~ x[ind, 1], family = binomial(logit))
      return(coefficients(result1))
    }, mc.cores=2)
    })[3]
    ptime
    et pour le deuxième exemple (celui qui posait problème) on a :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     
    library(parallel)
    ?mclapply
    i <- 0
    ptime <- system.time({
      testx <- mclapply(0:100000, function(i) {
        i <- i+1
        result1 <- sqrt(i) 
        return(result1)
      }, mc.cores=2)
    })[3]
    ptime
    Si vous avez des idées d'améliorations n'hésitez pas.
    Cdt

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. select avec calcul sur plusieurs colones ?
    Par mohe27 dans le forum SQL
    Réponses: 7
    Dernier message: 08/03/2011, 11h42
  2. Help!! Probleme avec les dates sur SQL SERVER
    Par Nadaa dans le forum MS SQL Server
    Réponses: 16
    Dernier message: 03/08/2006, 16h55
  3. probleme avec les string sur ITA2 64 bits!
    Par vince3320 dans le forum SL & STL
    Réponses: 5
    Dernier message: 22/08/2005, 19h59
  4. Calcul sur plusieurs champs similaires
    Par Zebulonn dans le forum Général JavaScript
    Réponses: 4
    Dernier message: 25/05/2005, 14h24
  5. Problem avec les *.AVI sur les panels
    Par NaDiA_SoFt dans le forum C++Builder
    Réponses: 3
    Dernier message: 31/08/2003, 22h50

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo