IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Big Data Discussion :

BI vs data science


Sujet :

Big Data

  1. #1
    Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2016
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2016
    Messages : 5
    Points : 4
    Points
    4
    Par défaut BI vs data science
    Bonjour à tous.

    Dans le cadre de mon travail de master, j'aimerais avoir l'avis des professionnels de la data science/big data sur la question suivante: pensez vous que la data science est le futur de la BI, ou tout au moins qu'elle l'impactera d'une façon ou d'une autre? Votre ressenti, votre vision m'intéresse.

    Audrey

  2. #2
    Membre du Club
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Décembre 2016
    Messages
    42
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Consultant en Business Intelligence
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Décembre 2016
    Messages : 42
    Points : 69
    Points
    69
    Par défaut
    Bonjour

    Avant de donner mon point de vue, je préfère commencer par ce que je comprends par "Big Data" et "Data Science"

    Data science :
    Il utilise comme outils : SAS, R, Python, SQL & BD, …
    Il travaille sur les données structurées et non structure en provenance des pages web pour la plupart,
    Il les rassemble, nettoyé, analyse pour ressortir des information utiles pour le Marketing internet/Digital, recherches, …

    Big Data
    Axé sur les 3 V (Volume-Variété-Vélocité) intervient lorsqu’on a à faire à de très grands volumes de données qui ne peuvent pas être traitée par des outils de traitement de données conventionnelles. Et tout cela démarre avec Hadoop avec son système de fichier HDFS.

    Pour moi, je ne verrai pas l’un comme le futur de l’autre. Bien que le but commun soit d’extraire une information à partir d’un ensemble de données, je vois beaucoup plus une complémentarité.

    Bonne journée
    wcfsmart

  3. #3
    Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2016
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2016
    Messages : 5
    Points : 4
    Points
    4
    Par défaut
    Merci wcfsmart pour votre point de vue.

    D'autres avis?

  4. #4
    Modérateur
    Avatar de DotNetMatt
    Homme Profil pro
    CTO
    Inscrit en
    Février 2010
    Messages
    3 611
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : CTO
    Secteur : Finance

    Informations forums :
    Inscription : Février 2010
    Messages : 3 611
    Points : 9 743
    Points
    9 743
    Billets dans le blog
    3
    Par défaut
    Pas simple comme question. Avant de commencer, je trouve que Big Data c'est plus un terme marketing fourre-tout, sur lequel beaucoup de gens se masturbent le cerveau et ne savent pas de quoi ils parlent. On peut donner plusieurs sens au Big Data.

    Pour faire simple, la BI permet de trouver des responses a des questions connues. Le Big Data permet de trouver des responses a des questions auxquelles on aurait pas pu penser sans avoir cette analyse de donnees heterogenes/volumineuse.

    Pour etre un peu plus complet, la BI permet de prendre des decisions basees sur des donnees generees, aggregees, analyses et visualisees (sous forme de rapport/dashboard). Ca permet aux decideurs d'avoir acces a des informations cles (les fameux KPI - Key Performance Indicator ou Indicateur Cle de Performance).

    Le Big Data permet de stocker des donnees et d'analyser des donnees provenant de plusieurs sources (internes/externes a l'entreprise, et sous differents formats). Ces donnees sont generalement peu structurees et il faut donc faire un gros travail de nettoyage, de structuration puis de jointure avant de pouvoir en extraire une quelconque information. Comme il y a beaucoup d'information, en general c'est un peu comme quand on rentre dans une librairie : on voit une quantite enorme de livres, on ne sait pas trop ce qu'on cherche et puis au fur et a mesure qu'on navigue entre les etageres on fini par trouver quelque chose d'interessant.
    Apres il y a plusieurs "types" de Big Data, le plus connu etant le "Big Data Analytics", c'est a dire qu'on analyse les donnees heterogenes pour en degager des KPI et ensuite restituer cela avec un systeme de BI en self-service (les utilisateurs ont acces aux faits et aux dimensions et ils sont libres de creer leurs propres rapports).
    Sur un precedent projet j'ai pu utiliser du big data tout autrement : on bossait sur un algorithme de machine learning destine a extraire certaines informations de documents PDF (donc non structures). Le machine learning nous permettait de pre-processer le texte des documents (par ex. pour verifier l'encodage, supprimer la punctuation, les "stopwords", etc.). Pourquoi le Big Data ? Parce que la masse de documents a analyser etait enorme et continue (les utilisateurs uploadaient constamment des documents, et les documents pouvaient etre composes de plusieurs milliers de pages) ; parce qu'extraire du texte d'un fichier PDF, le parser pour remplacer/supprimer des caracteres, l'envoyer au service de machine learning puis analyser les resultats sont des operations couteuses et longues. Donc il ne faut pas perdre de vue que le Big Data ca peut aussi s'utiliser pour faire autre chose que faire de l'Analytics.

    Au final je rejoins wcfsmart sur le fait que BI et Big Data sont plutot complementaires quand on parle d'Analytics. Mais le Big Data peut aussi etre totalement different du BI et ne pas etre complementaires... Tout depend du contexte.
    Less Is More
    Pensez à utiliser les boutons , et les balises code
    Desole pour l'absence d'accents, clavier US oblige
    Celui qui pense qu'un professionnel coute cher n'a aucune idee de ce que peut lui couter un incompetent.

  5. #5
    Membre averti
    Homme Profil pro
    Data scientist
    Inscrit en
    Février 2017
    Messages
    211
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Data scientist
    Secteur : Conseil

    Informations forums :
    Inscription : Février 2017
    Messages : 211
    Points : 343
    Points
    343
    Par défaut point de vue
    Bonjour,

    De mon point de vue le mot "Big Data" ne veut rien dire de plus que "gros volume de données" et la question qui me dérange vraiment c'est à partir de quel point une data devient "Big". Il a plusieurs personne qui disent "big data" pour parler de la data science ou de la BI et c'est généralement des personnes qui ne connaissent pas trop des deux métiers.

    La data science et la BI étant deux disciplines différentes (Même s'il s’alimente par la même matière première qui est la data), l'une ne peut être un remplacent ou un futur d'une autre. La BI et la data science traitent deux problématiques et sujets différents, une ( la BI ) se comporte sur la création de tableau de bord ( qu'on appelle indicateurs en continue en dans un intervalle de temps ) comme une sorte de visualisation de données qui peuvent d'être interpréter de différentes façons, alors que la data science et un ensemble de méthode mathématiques pour extraire, valider ou autre... de l'information qui peuvent être des fois extraites de la BI. Je donne un exemple, la BI peut nous dire que les ventes aujourd'hui ont augmenter de 10% par rapport à hier, alors que la data science peut nous dire que les ventes ont augmenté de 10% et cela est dû au nombre de femme élevé observé aujourd'hui qui peut être expliqué par les conditions météorologiques... et nous pouvons vous assurer à 95% que demain cette influence sera augmentée d'entre 9.5% et 11%. ( C'est un exemple ) .

    Je pense que plutôt la BI et la data science sont deux choses qui se complète.

  6. #6
    Candidat au Club
    Femme Profil pro
    Étudiant
    Inscrit en
    Décembre 2016
    Messages
    5
    Détails du profil
    Informations personnelles :
    Sexe : Femme
    Localisation : Suisse

    Informations professionnelles :
    Activité : Étudiant
    Secteur : Conseil

    Informations forums :
    Inscription : Décembre 2016
    Messages : 5
    Points : 4
    Points
    4
    Par défaut Merci
    Passionnant tout ça!

    Vos commentaires me donnent une toute autre vision de la BI.

    Si j'ai bien compris, l'analytique en BI ( autre qu'en self service) se limite vraiment aux simples calculs statistiques, et aux requêtes SQL qui alimentent le tableau de bord!

    Connaissant les capacités des algorithmes (regression, arbres, cluster...) je me bornais vraiment à croire qu'ils étaient très utilisés en BI.

  7. #7
    Modérateur
    Avatar de DotNetMatt
    Homme Profil pro
    CTO
    Inscrit en
    Février 2010
    Messages
    3 611
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 36
    Localisation : Etats-Unis

    Informations professionnelles :
    Activité : CTO
    Secteur : Finance

    Informations forums :
    Inscription : Février 2010
    Messages : 3 611
    Points : 9 743
    Points
    9 743
    Billets dans le blog
    3
    Par défaut
    Citation Envoyé par audonf Voir le message
    Si j'ai bien compris, l'analytique en BI ( autre qu'en self service) se limite vraiment aux simples calculs statistiques, et aux requêtes SQL qui alimentent le tableau de bord!
    En gros et pour faire simple, oui.

    Citation Envoyé par audonf Voir le message
    Connaissant les capacités des algorithmes (regression, arbres, cluster...) je me bornais vraiment à croire qu'ils étaient très utilisés en BI.
    Ces algorithms sont aussi bien utilises en BI qu'en Machine Learning Et en BI ils sont tres sollicites quand on veut faire de l'analyse predictive, entre autre.
    Less Is More
    Pensez à utiliser les boutons , et les balises code
    Desole pour l'absence d'accents, clavier US oblige
    Celui qui pense qu'un professionnel coute cher n'a aucune idee de ce que peut lui couter un incompetent.

Discussions similaires

  1. BI vs data science
    Par audonf dans le forum Débats
    Réponses: 0
    Dernier message: 13/12/2016, 15h59
  2. Réponses: 1
    Dernier message: 10/07/2016, 12h53
  3. Réponses: 0
    Dernier message: 17/12/2015, 19h01
  4. [Pointer]Treeview.Data
    Par rbag dans le forum Composants VCL
    Réponses: 7
    Dernier message: 31/08/2002, 01h44

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo