IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

SSIS Discussion :

[SSIS] [2K8] Gestion des doublons dans la destination


Sujet :

SSIS

  1. #1
    Membre du Club
    Inscrit en
    Février 2005
    Messages
    116
    Détails du profil
    Informations forums :
    Inscription : Février 2005
    Messages : 116
    Points : 44
    Points
    44
    Par défaut [SSIS] [2K8] Gestion des doublons dans la destination
    J'ai crée un package permettant d'alimenter ma dimension. Seulement lorsque j'exécute mon package plusieurs fois ma dimension est rempli avec autant de doublons. Avec quoi gérer ca ?

  2. #2
    Membre émérite Avatar de FrancoisJehl
    Homme Profil pro
    BI Engineer
    Inscrit en
    Juillet 2009
    Messages
    1 485
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : BI Engineer
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Juillet 2009
    Messages : 1 485
    Points : 2 883
    Points
    2 883
    Par défaut
    Alors deux approches:
    1) Vider la dimension à chaque fois (SQL Command avec un DELETE avant ton Data Flow) mais ça t'empêche d'historiser
    2) N'alimenter que ce qui est neuf

    Pour filtrer ce qui est nouveau tu as plusieurs solutions:
    - Utiliser un composant Lookup et n'insérer que les lignes en NoMatch
    - Utiliser une table temporaire puis une instruction type MERGE en SQL (pour les plus grosses volumétries)
    - Si jamais tu dois gérer des cas plus complexes d'historisation (genre comment gères tu les UPDATE?) tu peux utiliser le composant SCD - lent... - ou le custom TableDifference de Russo et Ferrari chez SQLBI http://www.sqlbi.com/?tabid=74. (Bon en custom il y a aussi Kimball SCD et un tas d'autres...)
    François JEHL
    BI Engineer | MVP SQL Server
    http://fjehl.wordpress.com
    Pour me contacter, par MP ou ici, mais pas pour des questions techniques.

    /*
    Avant de poster cherchez dans la FAQ et utilisez la fonction "Rechercher" du forum.
    Au moment de poster, posez votre question dans le bon sous-forum (Débuter, SSAS, SSRS, SSIS), en utilisant les TAGs prédéfinis ([2K], [2K5], [2K8], [2K8R2]).
    */

  3. #3
    Membre du Club
    Inscrit en
    Février 2005
    Messages
    116
    Détails du profil
    Informations forums :
    Inscription : Février 2005
    Messages : 116
    Points : 44
    Points
    44
    Par défaut
    merci, je vais utiliser un filtre de date pour faire un chargement incrémental. Donc si j'ai bien compris, si j'exécute mon package plusieurs fois c'est normal d'avoir des doublons dans la dimension. On ne peut pas empêcher ca, sauf en vidant la base intermédiaire c'est juste ?

  4. #4
    Membre chevronné

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Août 2007
    Messages
    1 216
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : Suisse

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Août 2007
    Messages : 1 216
    Points : 1 758
    Points
    1 758
    Par défaut
    Bonjour,

    Pensez a definir un/des index unique(s) sur votre table, ca vous permettra aussi d'eviter les doublons.

    Bonne journee

  5. #5
    Membre émérite Avatar de FrancoisJehl
    Homme Profil pro
    BI Engineer
    Inscrit en
    Juillet 2009
    Messages
    1 485
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : BI Engineer
    Secteur : High Tech - Produits et services télécom et Internet

    Informations forums :
    Inscription : Juillet 2009
    Messages : 1 485
    Points : 2 883
    Points
    2 883
    Par défaut
    Donc si j'ai bien compris, si j'exécute mon package plusieurs fois c'est normal d'avoir des doublons dans la dimension
    Dis toi simplement que les destinations de Data Flow font des INSERT - et pas des UPDATE - (au sens SQL) dans les tables de destination, d'où le doublonnage. La mise à jour sur insertion c'est à toi de la gérer.
    François JEHL
    BI Engineer | MVP SQL Server
    http://fjehl.wordpress.com
    Pour me contacter, par MP ou ici, mais pas pour des questions techniques.

    /*
    Avant de poster cherchez dans la FAQ et utilisez la fonction "Rechercher" du forum.
    Au moment de poster, posez votre question dans le bon sous-forum (Débuter, SSAS, SSRS, SSIS), en utilisant les TAGs prédéfinis ([2K], [2K5], [2K8], [2K8R2]).
    */

Discussions similaires

  1. Procédure stockée : gestion des doublons dans une table
    Par Mothership dans le forum Administration
    Réponses: 4
    Dernier message: 22/07/2009, 11h29
  2. [SSIS] [2K8] Gestion des transactions
    Par patriceharel dans le forum SSIS
    Réponses: 3
    Dernier message: 09/07/2009, 15h11
  3. [Toutes versions] Gestion des doublons dans une liste technique.
    Par Lorenzogazier dans le forum Requêtes et SQL.
    Réponses: 7
    Dernier message: 02/04/2009, 22h45
  4. [SSIS][2K5]Gestion des doublons
    Par aurelie83 dans le forum SSIS
    Réponses: 4
    Dernier message: 10/10/2008, 11h05

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo