Chers collègues, amis, sympathisants,
Quelques nouvelles du projet "R++, the Next Step!" (qui malgré le silence de la newsletter est toujours très actif, comme vous allez pouvoir le constater). Comme d'habitude, je donne des nouvelles brèves, n'hésitez pas à me contacter si un sujet vous intéresse plus particulièrement.
1/ Axe IHM : deux séances de prototypage vidéo ont eu lieu. Les résultats de nos cogitations et les vidéo des premiers prototypages sont là :
https://www.lri.fr/~mbl/R++/
2/ Axe compilation : Joël Falcou est en train de terminer une première version du compilateur. Elle devrait être testable fin septembre (sous toute réserve)
3/ Axe big data : deux étudiants (Houssem Dine et Radwane Ben Abdelali) sont en stage M2. Les premiers résultats confirment ce que nous pensions déjà : en statistique, big data signifie "giga" alors qu'avec Oracle, on peut monter a 50 terra. Il y a vraiment beaucoup à gagner dans ce champ. Nous sommes d'ailleurs en phase de recherche d'une bourse de thèse. Deux pistes sont à l'étude : une cotutelle avec la Tunisie (ce qui serait une très bonne chose pour le projet et lui donnerait une dimension internationale) ou une bourse CIFRE. Si vous avez des pistes ou que vous connaissez des industriels potentiellement intéressés, n'hésitez pas à nous en faire part. L'objectif de la thèse sera de faire passer à l’échelle (Terra) un certain nombre de techniques statistiques de base (analyse univariée, test, régressions, ou autre selon les besoins spécifiques de l'industriel)
3bis/ Résultat plus surprenant, Julia-le-fameux N'EST PAS plus rapide que R. Il est beaucoup plus rapide sur les petites données. Mais des qu'on augmente la taille des données, alors R reprend le dessus et est même beaucoup plus rapide que Julia.
4/ Axe parallélisme : un étudiant est en stage (Chai Anchen), il a parallélisé la technique du bootstrap avec un gain de x11 sur une machine a 12 processeurs. Il commence les imputations multiples, le gain est plutot de l'ordre de x500...
5/ Enfin, et c'est nouveau, différentes entreprises (précisément trois) ont entendu parler du projet et se sont montrées intéressées. Elles m'ont contacté afin d'en savoir un peu plus. J'ai rendez-vous en septembre pour des présentations...
Amicalement
Partager