Juste 3 liens :
- document "State-of-the-Art in Parallel Computing with R"
http://epub.ub.uni-muenchen.de/8991/ ou
http://rostlab.in.tum.de/~schmidb/RP...rse/index.html
- http://cran.r-project.org/web/view/H...Computing.html
On y trouvera les différentes approches pour faire du parallélisme avec R, des bench., les différents packages concernés, ...
J'avais utilisé Rmpi (en liaison avec OpenMPI et SGE -Sun Grid Engine-) sur un cluster de 10 machines. Cette approche est évidemment pas simple à implémenter sur avec un nouveau langage. J'ai testé aussi l'optimisation des boucles foreach avec doMC et doMPI toujours dans le même environnement.
Je pense qu'il faudra plutôt s'orienter vers une approche multicores/multicpu(s) (pas de cluster de machines, pas au dessus d'une implémentation de MPI, pas de grille, ...).
L'expérience des packages "parallel", "multicore", "snow", ... peut bien nous aider.
Partager