IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Alimentation Discussion :

ETL open source équivalent à SSIS


Sujet :

Alimentation

  1. #1
    Membre régulier
    Homme Profil pro
    Auditeur informatique
    Inscrit en
    Février 2012
    Messages
    131
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Auditeur informatique

    Informations forums :
    Inscription : Février 2012
    Messages : 131
    Points : 107
    Points
    107
    Par défaut ETL open source équivalent à SSIS
    Bonjour,

    J'ai eu une expérience avec SSIS qui était bonne lors de ma précédente mission. Je souhaiterai savoir s'il existe un équivalent en open source. La société dans laquelle je suis actuellement est plutôt axé open source d'où ma question.
    D'après mes recherches, je doute qu'il existe un équivalent. Faut avouer que SSIS est quand même bon et facilite pas mal de chose.

  2. #2
    Modérateur
    Avatar de Waldar
    Homme Profil pro
    Customer Success Manager @Vertica
    Inscrit en
    Septembre 2008
    Messages
    8 452
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Customer Success Manager @Vertica
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2008
    Messages : 8 452
    Points : 17 820
    Points
    17 820
    Par défaut
    Pour la question, les seuls ETL open source dont j'ai entendu parler sont Kettle Pentaho et Talend. Je ne les ai jamais utilisé mais c'est un point de départ.
    Une petite recherche permet d'en trouver d'autres.

    Par contre, je ne peux pas vous laisser dire que SSIS est bon !
    C'est de loin le pire des ETL que j'ai côtoyé (parmi PowerCenter et OTIC / Genio).

    • Client horriblement lent et peu réactif dès qu'on a trente boîtes à l'écran, avec des bugs dans tous les sens (des boîtes invisibles par exemple, qui existent mais avec lesquelles on ne peut plus interagir).
    • On a le choix entre écrire du code ensembliste et donc rapide, ou utiliser les boîtes pré-faites et on se retrouve à faire du pseudo ligne à ligne.
    • Quid des delete / truncates ? Il faut les écrire à la main.
    • Les messages d'erreur quand les jobs plantent sont une plaisanterie.
      Si on n'a pas tout anticipé à l'avance, on n'a aucune idée de ce qui plante. Voici le message d'erreur type :
      Job has failed.
    • Les syntaxes update à l'ODBC : Update MaTable set col1 = ?, col2 = ?, col3 = ?, col4 = ?, col5 = ? where col6 = ? and col7 = ?.
      Très amusant quand on arrive à quelques dizaines de colonnes.
    • Trois mille options inutiles dans lesquelles se noient cinq options intéressantes.
    • Les connecteurs pour Oracle étaient une plaisanterie avant 2011/2012 et les connecteurs Attunity ! Pour un ETL il fallait l'expliquer au client qu'ils ne devaient pas avoir d'Oracle.
    • Typages des données contre intuitifs. Vous êtes déjà perdu avec la dizaine de types de données SQL ? SSIS vous en a pondu trente dont douze rien que pour gérer des nombres.
    • SSIS se prononce saucisse en français.


    SSIS c'est bien pour écrire des jobs de maintenance DBA, des packages simples d'échange de données ou piloter des procédures stockées.
    Ne faites pas de décisionnel avec.

  3. #3
    Membre éprouvé Avatar de Jester
    Inscrit en
    Septembre 2003
    Messages
    813
    Détails du profil
    Informations forums :
    Inscription : Septembre 2003
    Messages : 813
    Points : 1 058
    Points
    1 058
    Par défaut
    Je confirme pour Kettle et Talend c'est les 2 majeurs du domaine.

    Je préfère Kettle qui est plus efficace mais un peu rustre, Talend étant plus indiqué pour ceux qui aiment les belles interfaces qui rament (je n'ai pas testé depuis l'an dernier par contre).

  4. #4
    Membre régulier
    Homme Profil pro
    Auditeur informatique
    Inscrit en
    Février 2012
    Messages
    131
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Auditeur informatique

    Informations forums :
    Inscription : Février 2012
    Messages : 131
    Points : 107
    Points
    107
    Par défaut
    Je pense qu'aucun ETL n'est parfait. Sachant que c'est la partie la plus importante (avec la modélisation) dans un projet BI, ce n'est pas simple de développer un truc parfait.
    A l'époque pour ce que j'en faisait, ça allait mais je suis d'accord qu'il n'est pas parfait. Je préfère SSIS que de devoir tout faire à la main en SQL, T_SQL, ...

  5. #5
    Expert confirmé
    Avatar de doc malkovich
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2008
    Messages
    1 884
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Juillet 2008
    Messages : 1 884
    Points : 4 285
    Points
    4 285
    Billets dans le blog
    1
    Par défaut
    Je confirme pour Talend et Kettle, avec une petite préférence pour Talend.

    Après les ETL se ressemblent tous, dans le sens où comme vous le dites ils permettent d'éviter des scripts sql à la main

    Citation Envoyé par Waldar Voir le message
    SSIS se prononce saucisse en français.
    mdr
    N'oubliez pas de cliquer sur lorsque votre problème est réglé !

  6. #6
    Candidat au Club
    Homme Profil pro
    Administrateur Data Warehouse
    Inscrit en
    Août 2013
    Messages
    3
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Administrateur Data Warehouse
    Secteur : Transports

    Informations forums :
    Inscription : Août 2013
    Messages : 3
    Points : 4
    Points
    4
    Par défaut
    Bonjour,

    J'utilise OTIC Genio depuis quelques années et je rejoins volontiers l'avis de Waldar, par contre je serais curieux de savoir en quoi PowerCenter peut poser problème ?

  7. #7
    Modérateur
    Avatar de Waldar
    Homme Profil pro
    Customer Success Manager @Vertica
    Inscrit en
    Septembre 2008
    Messages
    8 452
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 46
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Customer Success Manager @Vertica
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2008
    Messages : 8 452
    Points : 17 820
    Points
    17 820
    Par défaut
    C'est SSIS qui pose problème, ni OTIC / Génio, ni PowerCenter même si on trouve des reproches à faire dans ces deux ELT / ETL.

  8. #8
    Membre à l'essai
    Profil pro
    Chef de projet MOE
    Inscrit en
    Février 2009
    Messages
    23
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : Chef de projet MOE

    Informations forums :
    Inscription : Février 2009
    Messages : 23
    Points : 18
    Points
    18
    Par défaut
    Bonjour à tous,

    Pour continuer ce post, je vous livre brièvement mon choix.

    ETL utilisés:
    - Informatica Power Center (propriétaire)
    - Datastage 7.1 (payant)
    - Talend (open source)
    - Pentaho (ex Kettle) (open source)
    - Formé à Oracle Data Integrator (ODI) et à SAP Data Integrator (ex Bodi)
    Tous 2 propriétaires.

    Le plus simple: Kettle (manque de puissance en version gratuite). Son moteur serait à changer pour lui donner toute la puissance qu'il mérite.

    Le plus intuitif: Bodi

    Le plus puissant : Bodi (c'est la rolls, utilisé par certains grands groupes et bourses)

    Kettle et Talend (en version payante) sont quasiment identiques en performances.

    ODI et Datastage sont compliqués d'utilisations. Je m'y perdais dans les modules à utiliser pour ODI. Je refuse d'utiliser ODI.

    Informatica a sa logique, quand elle est comprise, il est simple et rapide et puissant.

    ODI est très présent dans les entreprises françaises, mais à chaque évolution une nouvelle interface.

    Mon ordre de préférence est:
    BODI
    Kettle
    Informatica
    Talend
    -- et loin derrière --
    Datastage
    puis
    ODI (ferme la marche!)

    Pour moi, l'avantage de Datastage est dans le changement des environnements et à distance.

    L'ETL Ab Initio est aussi considérer comme une rolls. Je l'ai vu à l'oeuvre chez OBS (Orange Business Service) dans la version gratuite. Très puissant et relativement facile d'utilisation quand il est maitrisé. Je n'ai pas eu accès à Ab Initio dans sa version payante.

    C'est tout pour aujourd'hui!

    A bientôt.

  9. #9
    Expert confirmé
    Avatar de doc malkovich
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Juillet 2008
    Messages
    1 884
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Nord (Nord Pas de Calais)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Juillet 2008
    Messages : 1 884
    Points : 4 285
    Points
    4 285
    Billets dans le blog
    1
    Par défaut
    Pour moi ODI est en tête et non en fin du palmarès
    J'avais fait un billet dessus dans le temps.

    C'est un ETL pas forcément très simple d'utilisation mais on se rend compte qu'il est très bien foutu quand on passe du temps dessus
    N'oubliez pas de cliquer sur lorsque votre problème est réglé !

Discussions similaires

  1. recherche des logiciels open source équivalent à iTunes
    Par jamaldine dans le forum Multimédia
    Réponses: 1
    Dernier message: 09/05/2007, 18h05
  2. ETL open source
    Par PAYASS59 dans le forum Alimentation
    Réponses: 2
    Dernier message: 01/04/2007, 12h58
  3. Quel est l'intéret d'un ETL Open Source
    Par clairette dans le forum Alimentation
    Réponses: 9
    Dernier message: 27/10/2006, 15h12
  4. choix ETL open source
    Par clairette dans le forum Alimentation
    Réponses: 5
    Dernier message: 11/05/2006, 09h16

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo