Bonjour,
Un processus d’analyse de données opérationnel en entreprise demande de nombreuses étapes de prétraitement avant de vraiment réaliser l’analyse statistique. Il faut par exemple charger les données via différentes sources et ensuite fusionner/transformer les tables pour obtenir un beau data set prêt à être analysé (c’est la partie ETL). Cette phase est souvent lourde et doit être automatisée.
Je suis actuellement sur un projet pour une entreprise qui utilise SAS pour les parties prétraitement de données, analyse statistique et reporting. Je ne suis pas un professionnel du SAS (je viens du milieu de la recherche où j’utilise R) mais il faut avouer que SAS arrive à bien intégrer toutes les étapes de l’analyse (du début à la fin).
Je voudrais défendre l’utilisation de R dans un nouveau projet. Il me faut donc des arguments![]()
Avez-vous déjà utilisé R sur des projets de moyenne/grande envergure ? Si oui, quel a été le retour ?
Selon vous, est-il possible d’utiliser R de manière efficace pour la partie prétraitement? Sinon quelle approche proposez-vous ? Utilisation de PL/SQL ?
Et si vous avez d’autres idées n’hésitez pas à me les communiquer
Merci !!
Partager