SSIS et qlikview

**cuteness10** · 16/04/2015, 11h14

Envoyé par cuteness10

Bonjour,
J'ai utilisé SSIS finalement parce qu'ils ont mis ça dans le cahier de charges, j'ai importé le fichier CSV dans une table que j'ai crée sur MSSMS et j'ai importé facilement les données dans la table puis j'ai ajouté des colonnes Flag (bonne pratique quoi) qui prendra soit un 0 soit 1 selon certaines critères.
Maintenant je vais charger cette table dans Qlikview et crée table de fait, et dimension et dim temps biensur et finalement vient la phase du reporting.

Mais ce qui m'a un peu perturbé ce que dans la charte du projet il est mentionné: qu'il faut ajouter une colonne Date dans la table sur sql server qui aura comme valeur la date du chargement du fichier CSV car les données qui sont dans ce fichier concernent les mêmes postes et les mêmes entités ce qui change ça sera quelques détails et ils ont écris comme quoi il faut suivre l'évolution de la sécurité dans les postes au cours du temps, mais je ne vois pas vraiment l'utilité de cette colonne et je ne sais pas comment la créer. Vous en pensez quoi ? depuis que vous m'avez expliqué la démarche j'ai une idée très claire maintenant mais là avec cette colonne date je ne sais pas ce qu'ils veulent vraiment. Donc vous en pensez quoi s'il vous plait ?
Cordialement,

voilà une solution pour ajouter la colonne date: http://blog.sqlauthority.com/2013/05...time-in-table/ et ça marche parfaitement

Mais j'ai toujours besoin de votre avis à quoi va servir cette colonne à votre avis ? est ce que l'axe temps qui sera crée sur Qlikview n'est t-il pas suffisant ?

N.B les données dans CSV contiennent les mêmes noms des postes les mêmes colonnes ce qui peut changer c'est par exemple pour un certain poste, dans la colonne ANTIVIRUS on peut trouvé NO antivirus et dans 3 mois (( ou peut étre jamais ce qui rend une ligne double pendant des mois et des mois si l'état de ce poste n'a pas changé)) on peut trouvé Antivirus détectée. Donc c'est juste l'état du poste qui change parfois d'où ils ont pensé à introduire la colonne Date, mais est ce que c'est vraiment nécessaire? puisque je suis que débutante je n'ai pas su savoir si c'est un vrai besoin ou non.

Cordialement,

**StringBuilder** · 16/04/2015, 14h45

Bonjour,

Là, on arrive plus dans vos règles "métier", donc là ça va être dur de répondre...

Si j'ai bien compris, vos fichiers CSV sont en réalité une photo, à une date donnée, d'un parc informatique ?

La colonne date permet donc d'historiser ces données : ce n'est pas parce que le 16 avril 2015 à 14:42 il y a Avast qui tourne sur mon PC que le 16 avril 2014 il était installé.
La colonne date va donc permettre de faire le lien entre la table de faits (logiciels présents sur chaque PC) et l'axe de dimension temps.

Ceci permettra alors par exemple de comparer le pourcentage de PC protégés dans le temps, de corréler l'évolution du nombre de pannes avec le nombre de machines protégées, de comparer l'efficacité des différents produits de protection en comparant le taux de pannes des PC les utilisant, etc.

Cette donnée est donc très importante !

Quant au problème de la donnée démultipliée par le nombre de jours dans l'année même si le PC n'évolue pas, ce n'est pas un problème pour QlikView, mise à part pour l'import. En effet, QV utilise une base vectorielle, et donc ne stocke pas physiquement les doublons, mais simplement des pointeurs vers la donnée initiale. Ça ne changera donc pour ainsi dire pas la taille du fichier.

Côté SSIS par contre, ça peut valoir le coup de suivre les changements de façon moins doublonnée, en utilisant une table d'historisation. Cependant, cela demande soit des requêtes lourdes pour l'alimenter, soit des triggers à l'insertion des données, soit des traitements dans vos modules d'import... Une perte de temps (en développement, maintenance, mais aussi à l'exécution) qui n'en vaut pas forcément la chandelle !

Commencez par benchmarker votre base telle qu'elle. Si elle ne fait que quelques centaines de Mo, ça ne devrait absolument rien changer au temps de chargement, surtout si vous générez des QVD en fin d'import dans SSIS !

http://www.quickintelligence.co.uk/qlikview-qvd-files/

**cuteness10** · 16/04/2015, 15h21

Envoyé par StringBuilder

Bonjour,

Là, on arrive plus dans vos règles "métier", donc là ça va être dur de répondre...

Si j'ai bien compris, vos fichiers CSV sont en réalité une photo, à une date donnée, d'un parc informatique ?

La colonne date permet donc d'historiser ces données : ce n'est pas parce que le 16 avril 2015 à 14:42 il y a Avast qui tourne sur mon PC que le 16 avril 2014 il était installé.
La colonne date va donc permettre de faire le lien entre la table de faits (logiciels présents sur chaque PC) et l'axe de dimension temps.

Ceci permettra alors par exemple de comparer le pourcentage de PC protégés dans le temps, de corréler l'évolution du nombre de pannes avec le nombre de machines protégées, de comparer l'efficacité des différents produits de protection en comparant le taux de pannes des PC les utilisant, etc.

Cette donnée est donc très importante !

Quant au problème de la donnée démultipliée par le nombre de jours dans l'année même si le PC n'évolue pas, ce n'est pas un problème pour QlikView, mise à part pour l'import. En effet, QV utilise une base vectorielle, et donc ne stocke pas physiquement les doublons, mais simplement des pointeurs vers la donnée initiale. Ça ne changera donc pour ainsi dire pas la taille du fichier.

Côté SSIS par contre, ça peut valoir le coup de suivre les changements de façon moins doublonnée, en utilisant une table d'historisation. Cependant, cela demande soit des requêtes lourdes pour l'alimenter, soit des triggers à l'insertion des données, soit des traitements dans vos modules d'import... Une perte de temps (en développement, maintenance, mais aussi à l'exécution) qui n'en vaut pas forcément la chandelle !

Commencez par benchmarker votre base telle qu'elle. Si elle ne fait que quelques centaines de Mo, ça ne devrait absolument rien changer au temps de chargement, surtout si vous générez des QVD en fin d'import dans SSIS !

http://www.quickintelligence.co.uk/qlikview-qvd-files/

Oui effectivement mes données sont une photo du parc informatique qui se trouve dans une entreprise et qui contient des informations : Serial Number machine, type OS, type Antivirus, Dernière mise à jour Antivirus,chassis(si le pc est Laptop or not) .......
et cette "photo" de l'état du parc se prend 2 fois par mois et pour qu'à la fin du mois ils font un Dashboard avec Excel des tableau et tout ça qui disent le pourcentage des postes sans antivirus dans l'entité tel ou tel et global.. mais maintenant ils optent pour une solution BI pour faire ce même travail bref c'est un peu ça donc vous avez tout compris.
Donc la table de fait contiendra par exemple: %postes avec NO windows 7, %postes avec NO AVAST, %postes avec NO Bitlocker .......
c'est exactement ça mon projet, et j'ai pensé à ajouter table de dim temps et table de dim entité..

donc ce que j'avais compris de votre réponse c'est que je dois absolument ajouter cette colonne date sur SSIS qui prend comme donnée: date de l'import, puisque après je vais importer cette même table qui est sur sql server dans QVD.
Mais si cette colonne va me permettre de suivre l'évolution dans le temps pourquoi j'aurai besoin d'une table de dimension temps ? (qui sera biensur crée dans qlikview).
désolé je n'avais pas bien saisi votre réponse sachez que je suis débutante c'est à travers ce projet que j'ai beaucoup appris. je suis vraiment désolé
Merci pour votre temps et votre effort
Cordialement,

**StringBuilder** · 16/04/2015, 15h46

Par ce que si par hasard pendant un mois il n'y a pas de relevé, il faut quand même que votre calendrier de sélection des périodes d'analyse le contienne, sinon on ne voit pas qu'il manque !

Le fait qu'il n'y ait pas de mesure pour une période donnée est une mesure en soit, et doit être mise en valeur dans les rapports.

**cuteness10** · 16/04/2015, 15h53

Envoyé par StringBuilder

Par ce que si par hasard pendant un mois il n'y a pas de relevé, il faut quand même que votre calendrier de sélection des périodes d'analyse le contienne, sinon on ne voit pas qu'il manque !

Le fait qu'il n'y ait pas de mesure pour une période donnée est une mesure en soit, et doit être mise en valeur dans les rapports.

d'accord StringBuilder merci beaucoup

SSIS et qlikview

QlikView

Discussions similaires

Partager

Partager