IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Décisions SGBD Discussion :

Choix SGBD pour projet Décisionnel


Sujet :

Décisions SGBD

  1. #1
    Membre à l'essai
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2014
    Messages
    13
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2014
    Messages : 13
    Points : 18
    Points
    18
    Par défaut Choix SGBD pour projet Décisionnel
    bonjour

    Je suis devant un choix majeur qui quel SGBD choisir(open source ) pour centralisé des données client (csv ,txt,xml, log ....).

    Environnement : Debian

    a noter :

    que ces donnée sont récolter et écrit écrit par Talend pour être par la suite traité en Datawarehouse .
    La volumétrie des bases est grandes .
    nombre accès concurrent >100

    infobright , infinidb ,postgree ..


    merci de votre aide

  2. #2
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 769
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 769
    Points : 52 720
    Points
    52 720
    Billets dans le blog
    5
    Par défaut
    Aucun de ces serveurs open source (PostGreSQL, MySQL...) ne propose de base purement décisionnelles. Ce sont tous des SGBDR relationnels.

    De plus si vous avez une forte volumétrie il vous faudra la version "Enterprise" de Talend, car la version free est techniquement bridée (en particulier pas de parallélisme).
    Entre nous c'est un piège à cons dans lequel tombe de nombreux clients et cela finit par couter notablement plus cher que d'utiliser de vrais bases décisionnelles avec les bons ETL comme ce que propose Oracle, Terradata ou MS SQL Sever !

    Voir le positionnement des outils de BI dans le "magic quadrant" du Gartner Grup qui évalue tous les ans ces outils :
    http://img.deusm.com/informationweek...drant-2015.jpg

    Vous n'y trouverez aucun outil "libre" !

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  3. #3
    Membre à l'essai
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2014
    Messages
    13
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2014
    Messages : 13
    Points : 18
    Points
    18
    Par défaut
    merci avant tout pour ta réponse .

    peut étre que je me suis mal exprimé , mon besoin est de créer une BDD relationnel centralisé alimenté par Talend depuis les serveurs clients a travers différent connecteur (cvs ,XLM ,ERP...) (1)
    Talend recuprére les données depuis BDD centralisé pour créer son DWH (2)

    sinon aviez vous des suggestion des BDD

    A+

  4. #4
    Expert confirmé
    Homme Profil pro
    Inscrit en
    Mai 2002
    Messages
    3 173
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 41
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Mai 2002
    Messages : 3 173
    Points : 5 345
    Points
    5 345
    Par défaut
    Citation Envoyé par SQLpro Voir le message
    Aucun de ces serveurs open source (PostGreSQL, MySQL...) ne propose de base purement décisionnelles. Ce sont tous des SGBDR relationnels.

    De plus si vous avez une forte volumétrie il vous faudra la version "Enterprise" de Talend, car la version free est techniquement bridée (en particulier pas de parallélisme).
    Entre nous c'est un piège à cons dans lequel tombe de nombreux clients et cela finit par couter notablement plus cher que d'utiliser de vrais bases décisionnelles avec les bons ETL comme ce que propose Oracle, Terradata ou MS SQL Sever !

    Voir le positionnement des outils de BI dans le "magic quadrant" du Gartner Grup qui évalue tous les ans ces outils :
    http://img.deusm.com/informationweek...drant-2015.jpg

    Vous n'y trouverez aucun outil "libre" !

    A +
    Bonjour,

    Talend se trouve dans le quadrant data integration, vu que c'est ce qu'il fait.

  5. #5
    Membre à l'essai
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2014
    Messages
    13
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2014
    Messages : 13
    Points : 18
    Points
    18
    Par défaut
    bonjour

    Est e que il y a des bon SGBD en open source a part Mysql et postgree qui gèrent bien les grandes volumétrie .

    Merci

  6. #6
    Modérateur
    Avatar de al1_24
    Homme Profil pro
    Retraité
    Inscrit en
    Mai 2002
    Messages
    9 080
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 63
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Retraité
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Mai 2002
    Messages : 9 080
    Points : 30 801
    Points
    30 801
    Par défaut
    La réponse rapide est : Non.
    Mais le terme "grande volumétrie" pour un entrepot de données n'est pas le même pour tout le monde.
    Qu'est-ce que ça signifie pour ton projet ?
    En données utilisées (hors tables de staging, index, réplication et blobs) : Des dizaines de gigaoctets ? des téraoctets ? des pétaoctets ?
    Et en chargement quotidien ?
    Modérateur Langage SQL
    Règles du forum Langage SQL à lire par tous, N'hésitez pas à consulter les cours SQL
    N'oubliez pas le bouton et pensez aux balises
    [code]
    Si une réponse vous a aidé à résoudre votre problème, n'oubliez pas de voter pour elle en cliquant sur
    Aide-toi et le forum t'aidera : Un problème exposé sans mentionner les tentatives de résolution infructueuses peut laisser supposer que le posteur attend qu'on fasse son travail à sa place... et ne donne pas envie d'y répondre.

  7. #7
    Membre à l'essai
    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Mars 2014
    Messages
    13
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Administrateur de base de données

    Informations forums :
    Inscription : Mars 2014
    Messages : 13
    Points : 18
    Points
    18
    Par défaut
    grande volumétrie : des téraoctets
    chargement : chaque heure

    Merci

  8. #8
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 769
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 769
    Points : 52 720
    Points
    52 720
    Billets dans le blog
    5
    Par défaut
    Citation Envoyé par punkoff Voir le message
    Bonjour,

    Talend se trouve dans le quadrant data integration, vu que c'est ce qu'il fait.
    Talend n'est pas un SGBD ! C'est un ETL...

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  9. #9
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 769
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 769
    Points : 52 720
    Points
    52 720
    Billets dans le blog
    5
    Par défaut
    Ce que vous voulez c'est donc juste la partie DataWareHouse... Et pas la partie analyse de données...

    OK, donc SGBDR va bien...

    Citation Envoyé par nabilmaktouf Voir le message
    bonjour

    Est e que il y a des bon SGBD en open source a part Mysql et postgree qui gèrent bien les grandes volumétrie .

    Merci
    Si pour vous grande volumétrie = plusieurs To alors non !

    Aucun des SGBDR "Free" ne savent gérer correctement le partitionnement, les opérations "ONLINE", la haute dispo ou n'intègrent un CDC...

    Vous pouvez envisager de faire tout cela à la main, avec quelques années de travail et une bonne équipe ce qui présentera un double avantage :
    1) résorber une partie du chômage local (à condition de trouver des informaticiens chevronnés)
    2) prendre du temps, donc du recul pour que la solution soit au final impeccable dans quelques années !

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  10. #10
    Membre extrêmement actif Avatar de ddoumeche
    Homme Profil pro
    Ingénieur recherche et développement
    Inscrit en
    Octobre 2007
    Messages
    1 676
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Singapour

    Informations professionnelles :
    Activité : Ingénieur recherche et développement

    Informations forums :
    Inscription : Octobre 2007
    Messages : 1 676
    Points : 2 009
    Points
    2 009
    Par défaut
    On peut très bien gérer des volumes d'ordre du pentaoctet avec des bases de données même primitives a condition d'opter pour un partitionnement efficace, ou du sharding.

    Cela dépend de la fréquence d'actualisation des données
    La joie de l'âme est dans la planification -- Louis Hubert Liautey

  11. #11
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 769
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 769
    Points : 52 720
    Points
    52 720
    Billets dans le blog
    5
    Par défaut
    Citation Envoyé par ddoumeche Voir le message
    On peut très bien gérer des volumes d'ordre du pentaoctet avec des bases de données même primitives a condition d'opter pour un partitionnement efficace, ou du sharding.

    Cela dépend de la fréquence d'actualisation des données
    Ce qui m'amuse c'est justement le point que vous citez... Aucun des 2 SGBDR que ce soit PostGreSQL ou MySQL ne dispose d'un partitionnement réellement efficace !
    Pour PG la mise en œuvre est aberrante.. Pour MySQL il est tout à fait inefficace en requête dans la plupart des cas.
    Enfin ces deux SGBDR ne sachant pas faire du parallélisme de requête ils sont inefficace si des requêtes doivent aller lire toutes les partitions !

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  12. #12
    Expert confirmé
    Avatar de rudib
    Homme Profil pro
    Fakir SQL Server & NoSQL
    Inscrit en
    Mai 2006
    Messages
    2 573
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Fakir SQL Server & NoSQL

    Informations forums :
    Inscription : Mai 2006
    Messages : 2 573
    Points : 4 043
    Points
    4 043
    Par défaut
    Bonjour,

    Considérez la possibilité d'un moteur NoSQL distribué. Cassandra est un bon produit qui est libre, très performant, qui monte en charge à l'infini et qui a un feeling proche d'un SGBDR : langage CQL proche du SQL, modélisation en tables. Il manque juste la relation, donc faites attention si vous voulez modéliser des relations entre vos tables, mais ce n'est peut être pas le cas ici si vous importez des logs.
    Exemple de modélisation en Cassandra dans cet article : http://ippon.developpez.com/tutoriel...ion-cassandra/
    Rudi Bruchez
    Rudi Bruchez EIRL, solutions MS SQL Server et NoSQL
    LinkedIn - [Outil libre de diagnostic SQL Server : Sql Trismegiste]
    LIVRES : Optimiser SQL Server -
    Microsoft SQL Server 2012 Security Cookbook
    - les bases de données NoSQL

    e-learning : LinkedIn Learning - Pluralsight

Discussions similaires

  1. Choix SGBD pour ASP.NET C#? et autres conseils
    Par pimos dans le forum Accès aux données
    Réponses: 8
    Dernier message: 31/12/2007, 11h30
  2. Choix SGBD pour application Delphi
    Par jesusnavas dans le forum Bases de données
    Réponses: 21
    Dernier message: 19/11/2007, 08h04
  3. Choix SGBD pour gérer des fichiers Excel et des images ?
    Par benoit69 dans le forum Décisions SGBD
    Réponses: 3
    Dernier message: 01/03/2007, 12h02
  4. Choix SGBD pour l'envoi d'e-mails ?
    Par toto14 dans le forum Décisions SGBD
    Réponses: 3
    Dernier message: 28/02/2007, 10h43
  5. Choix SGBD pour un intranet
    Par Balbuzar dans le forum Décisions SGBD
    Réponses: 4
    Dernier message: 03/06/2005, 17h04

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo