IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Forum général Business Intelligence Discussion :

La Data Preparation, nouvelle discipline de la Business Intelligence


Sujet :

Forum général Business Intelligence

  1. #1
    Membre habitué

    Profil pro
    Inscrit en
    Avril 2005
    Messages
    124
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2005
    Messages : 124
    Points : 154
    Points
    154
    Par défaut La Data Preparation, nouvelle discipline de la Business Intelligence
    Les utilisateurs métier ont toujours connu une certaine frustration de ne pas avoir leurs jeux de données, leurs rapports, leurs tableaux de bord aussi rapidement qu'ils le voudraient. En plus, il faut bien noter que l'utilisateur final connaît très bien les données qu'il renseigne au quotidien. Il est même celui qui élabore ou aide à l’élaboration des cahiers des charges. Qui plus est l'utilisateur métier connaît de plus en plus ses données pour beaucoup les manipuler depuis longtemps via les tableurs ! N'est-ce pas ? Alors pourquoi ne pas lui confier la manipulation des données, au lieu de tout laisser à la DSI !

    C'est ici qu'intervient la Data Preparation ! L'utilisateur est assisté dans 7 phases
    1. Importation
    2. Découverte
    3. Organisation
    4. Nettoyage
    5. Enrichissement
    6. Validation
    7. Publication


    La Data Preparation vient renforcer le courant du "Self service BI".

    Je vous invite à lire le livre blanc de Synaltic qui concerne ce nouveau pan de la business intelligence sur http://datapreparation.fr/

    Pouvez-vous s'il vous plaît laisser votre opinion suite à la lecture du livre blanc.

    Bien à vous.
    E-Gwada
    ===============================
    site developpez.com : http://charly-clairmont.developpez.com
    site pro : https://www.synaltic.fr/

  2. #2
    Membre émérite Avatar de nuke_y
    Profil pro
    Indépendant en analyse de données
    Inscrit en
    Mai 2004
    Messages
    2 076
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Indépendant en analyse de données

    Informations forums :
    Inscription : Mai 2004
    Messages : 2 076
    Points : 2 370
    Points
    2 370
    Par défaut
    Bonjour,

    ce n'est pas inintéressant, il y a de bonnes choses, surtout un discours innovant par rapport à la BI traditionnelle, et une volonté de redonner de l'autonomie au business dans l'exploitation de ses données, c'est tout à fait louable de mon point de vue. Les 5 premières étapes font aussi partie de ma propre méthode d'analyse des données, je suis très content de les retrouver dans les méthodes d'autres personnes.

    Par contre l'analyse exposée, et le concept même, me semblent présenter beaucoup de failles, quelques unes en vrac:

    il faut bien noter que l'utilisateur final connaît très bien les données qu'il renseigne au quotidien.
    Non justement, c'est même dramatique à quel point le business ne connaît pas ses données. C'est même un petit jeu auquel je me livre souvent avec nos prospects: ouvrez-nous vos données et nous vous apprendrons des choses sur vos données que vous ne savez pas vous-même, et ça sans même connaître votre métier. Et je gagne à chaque fois. La raison est simple : le business connaît bien son métier et les process qui sont censés encadrer l'activité et produire des données, mais il ne contrôle que très rarement l'adéquation entre les process et la réalité des données. D'où les problèmes de data quality, bien sûr, mais aussi des problèmes plus graves comme une mauvaise urbanisation des données, l'absence de master data management, les reportings faux, etc.

    - ce que vous décrivez comme la "data préparation" n'a rien de nouveau, lui donner un nom pour le marketing (et au passage faire de la publicité à votre entreprise, c'est de bonne guerre) n'apporte pas de fonctionnalités supplémentaires. Typiquement c'est quelque chose assuré par Qlikview depuis son origine. Ce que vous mettez en évidence c'est juste les lacunes d'outils comme Tableau, Spotfire, Lumira, Watson Analytics et autres sur la préparation de la donnée, lacunes très handicapantes de mon point de vue, mais de là à considérer ça comme une "nouvelle entité" de la BI... Disons plutôt qu'il y a de nouveaux courants de pensées, de nouvelles méthodes, ça ok.

    - le gros du document est constitué de benchmarks non appliqués à des cas concrets, seulement des tests théoriques et des informations données par les éditeurs. 2 de mes anciens collègues avaient monté une analyse de ce genre en seulement 1 semaine, sans installer aucun des outils "testés" et l'analyse semblaient pourtant pertinente en 1ere lecture donc je reste méfiant.

    - je ne sais pas quelle est l'expérience des personnes derrière ce livre blanc, mais ça semble un peu léger comme analyse, avec beaucoup de principes simples, comme si toute la Data Intelligence du monde pouvait s'expliquer avec une seule méthode. Exemple:
    Cette étape [Organisation] est également importante de par le fait qu’elle vous permettra [...] de faire passer la représentation des données d'un modèle relationnel à un modèle dimensionnel : La finalité d’un datawarehouse est désormais accessible à une personne non experte en informatique : d’où la puissance de la data preparation.
    Je ne pense pas qu'être assisté à à faire une série de left join, des tables de lookup, un peu de data quality puisse remplacer l'expertise nécessaire à la BI. J'en suis même convaincu et j'en veux pour preuve tous les sujets où j'assiste des gens du métier à faire ce travail là, en essayant de leur expliquer qu'établir un modèle de données agile et efficace, ça s'apprend.

    - il y a des affirmations péremptoires sans aucune justification, exemple:
    La BI traditionnelle ne correspond plus aux attentes du marché. Elle a besoin de se rendre plus ouverte et plus accessible aux utilisateurs métier.
    Il me semble que les éditeurs de BI "traditionnelle" n'ont jamais autant vendu de licences alors que les éditeurs alternatifs n'ont toujours pas réussi à creuser leur trou, ça manque un peu de référence comme affirmation (la mienne aussi, mais ce n'est pas un livre blanc).

    - il faudrait quand même ne pas oublier que, à l'origine, si la BI est apparue ce n'est pas que pour le fun: à la base il y a de vraies problématiques techniques qui ont poussé de grands penseurs à chercher de nouvelles solutions. Certaines problématiques ont été résolues (l'espace disque et la RAM ne coûtent plus grand chose par exemple) mais pas toutes, et surtout de nouvelles sont apparues. Si les technologies modernes facilitent la vie sur plein d'aspects, comme l'indexation ou la création de représentations visuelles par exemple, les informaticiens sont toujours lourdement sollicités pour faire leur métier : assister le business dans le traitement de l'information. Prenez un groupe de 100 top managers, et expliquez-leur les différents types de SCD, vous en perdrez les 2/3 et le tiers restant, bien qu'ayant compris, devra acquérir l'expérience nécessaire à ce genre de traitement. Et cette expérience demande du temps. Et le temps ils ne l'ont pas, car ils ont déjà leur métier à faire, pas le temps d'apprendre le métier des informaticiens.

    - vous occultez toute la partie Big Data, et même data mining, avec ses contraintes très fortes, les difficultés de déploiement, d'administration, etc. De même quand vous dites
    Les solutions Big Data ont permis de modifier cette approche en stockant les données sans se soucier de la récupération de leurs schémas. Les processus de traitement des données ont ainsi pu gagner en agilité. La data preparation est un phénomène suivant cette tendance. En effet, l’utilisateur d’une solution de data preparation n’a pas à réfléchir au schéma de son jeu de données lorsqu’il travaille dessus.
    Savez-vous à quel point c'est dur de travailler sur des données peu/mal/pas structurées ? Il faut déployer une expérience et des connaissances phénoménales pour en retirer des données pertinentes, au risque de produire une analyse qui ne veut rien dire. Attention, je soutiens la démarche de ne pas trop structurer les données en amont, mais par expérience je peux vous dire qu'on ne peut absolument pas laisser une personne peu compétente face à ce genre de tâche.


    Bref un très bon livre blanc, qui plaira beaucoup aux DSI et aux débutants de par sa simplicité et ses affirmations sans nuance, mais les experts passeront leur chemin.
    Il vaut mieux monopoliser son intelligence sur des bêtises que sa bêtise sur des choses intelligentes.

  3. #3
    Membre habitué

    Profil pro
    Inscrit en
    Avril 2005
    Messages
    124
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2005
    Messages : 124
    Points : 154
    Points
    154
    Par défaut
    Bonjour,

    Merci pour ce retour très détaillé.

    Avant tout effectivement nous avons certainement été simplistes pour que le livre blanc soit abordable pour le plus grand nombre. Et forcément, il paraitra "trop" léger vis à vis des spécialistes.

    A nos yeux la Data Preparation apportée par ces nouveaux outils cités dans le livre blanc ont réellement quelque chose de différent des solutions plus anciennes du marché, offrant alors plus d'autonomie aux utilisateurs finaux. Le succès de Tableau montre à quel point cet utilisateur final peut s'impliquer.

    Peut-être sommes nous trop optimistes et quant à un ré-équilibrage entre métier et DSI, tout du moins dans en business intelligence ! Mais il est indéniable que les offres du type self-service progressent !

    De même, les utilisateurs finaux n'auront sans doute pas à connaître le comment de nos complexités d'architecture informatique... Nous les emmenons tous trop souvent là dedans ! Par contre, pour sûr nous aurons encore besoin d'éduquer et apprendre à l'utilisateur final sur la manière dont il pourra toujours mieux prendre en main les données.

    Encore merci pour votre retour.
    E-Gwada
    ===============================
    site developpez.com : http://charly-clairmont.developpez.com
    site pro : https://www.synaltic.fr/

Discussions similaires

  1. Réponses: 0
    Dernier message: 17/10/2011, 16h10
  2. Les nouvelles solutions de Business Intelligence (14 mai), Paris
    Par Fleur-Anne.Blain dans le forum Forum général Business Intelligence
    Réponses: 0
    Dernier message: 09/05/2009, 19h16

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo