J'ai crée un package permettant d'alimenter ma dimension. Seulement lorsque j'exécute mon package plusieurs fois ma dimension est rempli avec autant de doublons. Avec quoi gérer ca ?
J'ai crée un package permettant d'alimenter ma dimension. Seulement lorsque j'exécute mon package plusieurs fois ma dimension est rempli avec autant de doublons. Avec quoi gérer ca ?
Alors deux approches:
1) Vider la dimension à chaque fois (SQL Command avec un DELETE avant ton Data Flow) mais ça t'empêche d'historiser
2) N'alimenter que ce qui est neuf
Pour filtrer ce qui est nouveau tu as plusieurs solutions:
- Utiliser un composant Lookup et n'insérer que les lignes en NoMatch
- Utiliser une table temporaire puis une instruction type MERGE en SQL (pour les plus grosses volumétries)
- Si jamais tu dois gérer des cas plus complexes d'historisation (genre comment gères tu les UPDATE?) tu peux utiliser le composant SCD - lent... - ou le custom TableDifference de Russo et Ferrari chez SQLBI http://www.sqlbi.com/?tabid=74. (Bon en custom il y a aussi Kimball SCD et un tas d'autres...)
François JEHL
BI Engineer | MVP SQL Server
http://fjehl.wordpress.com
Pour me contacter, par MP ou ici, mais pas pour des questions techniques.
/*
Avant de poster cherchez dans la FAQ et utilisez la fonction "Rechercher" du forum.
Au moment de poster, posez votre question dans le bon sous-forum (Débuter, SSAS, SSRS, SSIS), en utilisant les TAGs prédéfinis ([2K], [2K5], [2K8], [2K8R2]).
*/
merci, je vais utiliser un filtre de date pour faire un chargement incrémental. Donc si j'ai bien compris, si j'exécute mon package plusieurs fois c'est normal d'avoir des doublons dans la dimension. On ne peut pas empêcher ca, sauf en vidant la base intermédiaire c'est juste ?
Bonjour,
Pensez a definir un/des index unique(s) sur votre table, ca vous permettra aussi d'eviter les doublons.
Bonne journee
Dis toi simplement que les destinations de Data Flow font des INSERT - et pas des UPDATE - (au sens SQL) dans les tables de destination, d'où le doublonnage. La mise à jour sur insertion c'est à toi de la gérer.Donc si j'ai bien compris, si j'exécute mon package plusieurs fois c'est normal d'avoir des doublons dans la dimension
François JEHL
BI Engineer | MVP SQL Server
http://fjehl.wordpress.com
Pour me contacter, par MP ou ici, mais pas pour des questions techniques.
/*
Avant de poster cherchez dans la FAQ et utilisez la fonction "Rechercher" du forum.
Au moment de poster, posez votre question dans le bon sous-forum (Débuter, SSAS, SSRS, SSIS), en utilisant les TAGs prédéfinis ([2K], [2K5], [2K8], [2K8R2]).
*/
Vous avez un bloqueur de publicités installé.
Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.
Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.
Partager