Bonjour à tous,
Je travaille actuellement à l'analyse de gros volumes de données avec R.
J'avais initialement stocké ces données dans une base de données NoSQL "Cassandra", pensant ensuite utiliser le package "RCassandra" pour aller chercher ces données. Malheureusement je n'ai pas réussi à faire fonctionner ce package R. Dans la mesure où il n'a pas été mis à jour depuis longtemps (2013), j'ai supposé qu'il n'est plus comptabile avec les dernières versions de "Cassandra".
Comme je ne veux pas écrire moi-même (si je peux l'éviter ^^) un package permettant de connecter R à une base de données NoSQL, je vais plutôt voir pour changer le format de ma base de données NoSQL. Donc avant de m'y lancer les yeux fermés, j'aurais voulu avoir vos retours quant à la solution à adopter/privilégier, surtout en fonction des packages R (de connections) disponibles et fonctionnant correctement ?
Pour le moment je serais plutôt tentée d'utiliser une base de données "CouchBase" mais j'ai aussi vu qu'avec R, "mongoDB" est souvent utilisé (tout en sachant que par rapport à mon besoin, l'utilisation d'une base de données NoSQL plutôt orientée colonne ou plutôt orientée document n'a aucune incidence ^^).
Voilà, ce post est pour avoir vos retours d'expériences à ce sujet, si retours il y a
Merci d'avance !
Cordialement,
A.D.
Partager