1. #1
    Membre éclairé

    Homme Profil pro
    Enseignant Chercheur
    Inscrit en
    septembre 2007
    Messages
    200
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Enseignant Chercheur
    Secteur : Santé

    Informations forums :
    Inscription : septembre 2007
    Messages : 200
    Points : 714
    Points
    714

    Par défaut Quelques nouvelles . . .

    Chers collègues, amis, sympathisants,

    Quelques nouvelles du projet "R++, the Next Step!" (qui malgré le silence de la newsletter est toujours très actif, comme vous allez pouvoir le constater). Comme d'habitude, je donne des nouvelles brèves, n'hésitez pas à me contacter si un sujet vous intéresse plus particulièrement.

    1/ Axe IHM : deux séances de prototypage vidéo ont eu lieu. Les résultats de nos cogitations et les vidéo des premiers prototypages sont là :

    https://www.lri.fr/~mbl/R++/


    2/ Axe compilation : Joël Falcou est en train de terminer une première version du compilateur. Elle devrait être testable fin septembre (sous toute réserve)

    3/ Axe big data : deux étudiants (Houssem Dine et Radwane Ben Abdelali) sont en stage M2. Les premiers résultats confirment ce que nous pensions déjà : en statistique, big data signifie "giga" alors qu'avec Oracle, on peut monter a 50 terra. Il y a vraiment beaucoup à gagner dans ce champ. Nous sommes d'ailleurs en phase de recherche d'une bourse de thèse. Deux pistes sont à l'étude : une cotutelle avec la Tunisie (ce qui serait une très bonne chose pour le projet et lui donnerait une dimension internationale) ou une bourse CIFRE. Si vous avez des pistes ou que vous connaissez des industriels potentiellement intéressés, n'hésitez pas à nous en faire part. L'objectif de la thèse sera de faire passer à l’échelle (Terra) un certain nombre de techniques statistiques de base (analyse univariée, test, régressions, ou autre selon les besoins spécifiques de l'industriel)

    3bis/ Résultat plus surprenant, Julia-le-fameux N'EST PAS plus rapide que R. Il est beaucoup plus rapide sur les petites données. Mais des qu'on augmente la taille des données, alors R reprend le dessus et est même beaucoup plus rapide que Julia.

    4/ Axe parallélisme : un étudiant est en stage (Chai Anchen), il a parallélisé la technique du bootstrap avec un gain de x11 sur une machine a 12 processeurs. Il commence les imputations multiples, le gain est plutot de l'ordre de x500...

    5/ Enfin, et c'est nouveau, différentes entreprises (précisément trois) ont entendu parler du projet et se sont montrées intéressées. Elles m'ont contacté afin d'en savoir un peu plus. J'ai rendez-vous en septembre pour des présentations...

    Amicalement

  2. #2
    Membre averti
    Homme Profil pro
    Data Scientist
    Inscrit en
    août 2013
    Messages
    139
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data Scientist
    Secteur : Industrie

    Informations forums :
    Inscription : août 2013
    Messages : 139
    Points : 336
    Points
    336

    Par défaut

    Bonjour,

    Merci pour ces nouvelles ! Le projet avance bien et j'ai hâte de manipuler des énormes bases de données (big data) avec R++ dans quelques années (voir moins )

    L'axe big data m'intéresse particulièrement vu l'ampleur que prend le phénomène et surtout vu la masse de données récoltées et très peu utilisé pour l'instant ! (Les outils classiques montrent leurs limites...)

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo