IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Forum général Business Intelligence Discussion :

Data warehouse en temps réel


Sujet :

Forum général Business Intelligence

  1. #1
    Membre habitué Avatar de i.chafai
    Homme Profil pro
    Chef de projet en SSII
    Inscrit en
    Décembre 2012
    Messages
    117
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Chef de projet en SSII
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2012
    Messages : 117
    Points : 167
    Points
    167
    Par défaut Data warehouse en temps réel
    Bonjour,
    Je suis un consultant BI et reporting dans une SSII spécialiste dans l'intégration des ERP. Nos clients sont généralement des PME.
    Le reporting qu'on est entrain de fait est basé généralement sur des vues ou des requêtes qui sont exécutés sur les bases de prod, mais pour des problèmes de performance et pour ne pas bloquée les utilisateurs on a pensé a passer par un data warehouse mais le problème ici est que les décideurs veulent toujours avoir les résultats en temps réel.
    Existe-t-il une solution pour avoir un data warehouse en temps réel?

    Merci par avance

  2. #2
    Nouveau membre du Club
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Novembre 2015
    Messages
    33
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Novembre 2015
    Messages : 33
    Points : 30
    Points
    30
    Par défaut
    Bonjour,
    le temps réel est abordé de nombreuses manière dans la BI.
    Mais de manière générale, tu devrais tenté de passer par les solutions ETL. Je n'ai travaillé que sur un seul projet en temps réel qui suivait le flux de donnée des logs des applications sources via Informatica Power exchange. Ensuite, dans Informatica Power Center, on gérais dans une mapplet les retour de Power Exchange. Le tout finissais par faire intervenir les nouvelles données en quelques minutes dans les rapports.
    Et pour le reste que j'ai pu lire, c'est surtout les ETL qui permettent de gérer le temps réel. Même Talend a lancé une offre l'année dernière.
    J'espère que cela pourras t'être utile

  3. #3
    Membre confirmé
    Homme Profil pro
    Architecte Décisionnel
    Inscrit en
    Mai 2006
    Messages
    363
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France, Hauts de Seine (Île de France)

    Informations professionnelles :
    Activité : Architecte Décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2006
    Messages : 363
    Points : 521
    Points
    521
    Par défaut
    Les solutions CDC (Change Data Capture) qui permettent de faire du temps quasi réel aux ETL sont effectivement applicables, mais il faut bien tenir compte qu'elles nécessitent de gros pré-requis, une connaissance assez pointue des produits impactés (et pas seulement l'ETL, la base source est primordiale dans ce type de cas).

    Ce sont par ailleurs des produits très sensibles a tout incident et nécessitant une supervision très pointue.

    En gros je ne recommande quasi jamais ce type de solution car les impacts organisationnels et techniques sont en général si lourds que les clients abandonnent.

  4. #4
    Membre habitué Avatar de i.chafai
    Homme Profil pro
    Chef de projet en SSII
    Inscrit en
    Décembre 2012
    Messages
    117
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Chef de projet en SSII
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2012
    Messages : 117
    Points : 167
    Points
    167
    Par défaut
    Citation Envoyé par Prjprj Voir le message
    Les solutions CDC (Change Data Capture) qui permettent de faire du temps quasi réel aux ETL sont effectivement applicables, mais il faut bien tenir compte qu'elles nécessitent de gros pré-requis, une connaissance assez pointue des produits impactés (et pas seulement l'ETL, la base source est primordiale dans ce type de cas).

    Ce sont par ailleurs des produits très sensibles a tout incident et nécessitant une supervision très pointue.

    En gros je ne recommande quasi jamais ce type de solution car les impacts organisationnels et techniques sont en général si lourds que les clients abandonnent.
    J'ai déjà pensé au CDC, mais le problème et que je suis sous la version Standard de SQL Server

  5. #5
    Membre émérite Avatar de nuke_y
    Profil pro
    Indépendant en analyse de données
    Inscrit en
    Mai 2004
    Messages
    2 076
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Indépendant en analyse de données

    Informations forums :
    Inscription : Mai 2004
    Messages : 2 076
    Points : 2 370
    Points
    2 370
    Par défaut
    Honnêtement sur du SQLServer Standard c'est pas évident. En investissant un peu il y a la solution d'avoir de la réplication SQLServer et donc d'avoir 1 base pour l'opérationnel et 1 base pour le reporting, la 2e étant synchronisée avec la 1ere avec une faible latence.

    Est-ce que tous les rapports sont vraiment nécessaires en temps réel? On s'en sort souvent ainsi: séparer

    • opérationnel temps réel : directement sur la base opérationnelle, faible volume, requêtes bien maîtrisées, seulement quelques cas d'usage éligibles
    • opérationnel quotidien : sur le DWH mis à jour tous les jours, pas de limitation de volume
    • décisionnel : forcément pas temps réel, sur le DWH
    • analytique (si on le sépare du décisionnel): forcément pas temps réel, sur le DWH (je ne rentre pas sur le débat des data lake)
    • alerting : réagir à un événement, l'analyser et prendre la décision de prévenir automatiquent l'utilisateur pour qu'il agisse. C'est le cas compliqué du décisionnel puisque c'est du décisionnel MAIS en temps réel, là il n'y a pas beaucoup de solutions propres (Bus de données + Complex Event Processing), mais pas mal de sales: triggers sur la BDD, process qui vérifie en permanence dans la base. L'idéal dans ce cas c'est de faire remonter ce besoin dans l'outil source (Sage ici si j'ai bien compris, pas de chance).
    Il vaut mieux monopoliser son intelligence sur des bêtises que sa bêtise sur des choses intelligentes.

  6. #6
    Membre habitué Avatar de i.chafai
    Homme Profil pro
    Chef de projet en SSII
    Inscrit en
    Décembre 2012
    Messages
    117
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Tunisie

    Informations professionnelles :
    Activité : Chef de projet en SSII
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Décembre 2012
    Messages : 117
    Points : 167
    Points
    167
    Par défaut
    Citation Envoyé par nuke_y Voir le message
    Honnêtement sur du SQLServer Standard c'est pas évident. En investissant un peu il y a la solution d'avoir de la réplication SQLServer et donc d'avoir 1 base pour l'opérationnel et 1 base pour le reporting, la 2e étant synchronisée avec la 1ere avec une faible latence.

    Est-ce que tous les rapports sont vraiment nécessaires en temps réel? On s'en sort souvent ainsi: séparer

    • opérationnel temps réel : directement sur la base opérationnelle, faible volume, requêtes bien maîtrisées, seulement quelques cas d'usage éligibles
    • opérationnel quotidien : sur le DWH mis à jour tous les jours, pas de limitation de volume
    • décisionnel : forcément pas temps réel, sur le DWH
    • analytique (si on le sépare du décisionnel): forcément pas temps réel, sur le DWH (je ne rentre pas sur le débat des data lake)
    • alerting : réagir à un événement, l'analyser et prendre la décision de prévenir automatiquent l'utilisateur pour qu'il agisse. C'est le cas compliqué du décisionnel puisque c'est du décisionnel MAIS en temps réel, là il n'y a pas beaucoup de solutions propres (Bus de données + Complex Event Processing), mais pas mal de sales: triggers sur la BDD, process qui vérifie en permanence dans la base. L'idéal dans ce cas c'est de faire remonter ce besoin dans l'outil source (Sage ici si j'ai bien compris, pas de chance).
    Merci pour votre réponse.
    Dans la majorité des cas, il n'y a pas vraiment un très grand besoin du temps réel c'est juste une culture chez mes clients.
    Le besoin est plutôt du opérationnel quotidien, ça sera mon rôle de convaincre mes clients a changé quelques mauvaise habitudes.

  7. #7
    Membre émérite Avatar de nuke_y
    Profil pro
    Indépendant en analyse de données
    Inscrit en
    Mai 2004
    Messages
    2 076
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Indépendant en analyse de données

    Informations forums :
    Inscription : Mai 2004
    Messages : 2 076
    Points : 2 370
    Points
    2 370
    Par défaut
    Oui essayez de les faire changer un peu dans leurs habitudes, ça vous facilitera la vie. Actuellement certains gros acteurs sont en train de tenter une nouvelle approche pour faire de la BI et de l'analytique au même endroit (et donc de la BI temps réel) comme SAP HANA mais honnêtement on attend de voir ce que ça donne avant de pousser ça comme l'architecture du futur.

    Autre solution : avez-vous contacté l'éditeur Sage pour savoir s'il n'est pas possible de mettre en place des événements ou des logs ? J'ai un autre client qui a Sage et ça nous avait déjà cassé les pieds, mais je n'ai pas eu l'occasion de questionner l'éditeur.

    Sinon il y a la solution "sale" d'avoir un très très bon DBA qui arrive à ajouter des fonctionnalités directement dans la BDD sans perturber Sage, des triggers par exemple mais il doit exister d'autres solutions. Il me semble que Sage est plutôt Old School et donc assez limité sur les accès BDD. C'est dangereux, donc il ne faut le faire qu'avec des experts reconnus et seulement si ça leur semble jouable. Moi par exemple je ne le ferais pas, pas assez compétent pour prendre ce risque.
    Il vaut mieux monopoliser son intelligence sur des bêtises que sa bêtise sur des choses intelligentes.

  8. #8
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 761
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 761
    Points : 52 547
    Points
    52 547
    Billets dans le blog
    5
    Par défaut
    Citation Envoyé par i.chafai Voir le message
    J'ai déjà pensé au CDC, mais le problème et que je suis sous la version Standard de SQL Server
    La version standard SQL Server 2016 SP1 inclus désomrais CDC.

    À défaut de CDC vous pouvez utiliser Change Tracking.

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

Discussions similaires

  1. icCube temps-réel big data : project pilote
    Par Marc Polizzi dans le forum Big Data
    Réponses: 0
    Dernier message: 02/11/2013, 11h16
  2. Mise à jour de données temps réel avec Pentaho Data Integration
    Par jonathansauret dans le forum kettle/PDI
    Réponses: 0
    Dernier message: 29/10/2008, 15h55
  3. Tracer Temps Réel avec la Data Acquisition Toolbox
    Par Dizayeure dans le forum MATLAB
    Réponses: 0
    Dernier message: 26/04/2008, 14h50
  4. Mise à jour en temps des réel des données du Data Warehouse
    Par Reskibil dans le forum Microsoft BI
    Réponses: 8
    Dernier message: 27/03/2008, 09h38
  5. [Data WareHouse] Alimenter dimension temps
    Par gg9595 dans le forum Alimentation
    Réponses: 9
    Dernier message: 30/08/2007, 19h31

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo