IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Alimentation Discussion :

Intégrité des données des tables de faits


Sujet :

Alimentation

  1. #1
    Membre du Club
    Inscrit en
    Octobre 2006
    Messages
    122
    Détails du profil
    Informations forums :
    Inscription : Octobre 2006
    Messages : 122
    Points : 47
    Points
    47
    Par défaut Intégrité des données des tables de faits
    Bonjour Amis,



    J’ai une colle en ce moment. J’ai du mal à trouver une politique de gestion de l’intégrité des données de mes tables de faits. En effet une question m’a été posée :
    Que fais-tu lorsqu’un job chargeant à moitié une table de fait se plante ? Doit-on vider totalement la table de faits et la recharger totalement ou doit-on poursuivre le chargement au point il s’était arrêté ? Si l’on choisit la dernière option, il faudra mettre en place une politique de gestion de l’intégrité des données de la table de faits, de telle sorte que chaque enregistrement soit unique. C’est à ce niveau que j’ai quelques difficultés.


    ETL: Datastage 7.0
    SGBD: Oracle 10G
    Reporting: Business Object XI
    Système d'exploitation: Unix pour ETL et SGBD; Win Server 2003 pour BO XI

    Merci d'avance.

  2. #2
    Membre éprouvé
    Homme Profil pro
    Architecte Décisionnel
    Inscrit en
    Février 2008
    Messages
    866
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte Décisionnel

    Informations forums :
    Inscription : Février 2008
    Messages : 866
    Points : 1 260
    Points
    1 260
    Par défaut
    Bonjour,

    De mon coté, je fais en sorte que tous mes traitements soient ré-entrants.
    En cas de plantage, il suffit de relancer.

    Cela simplifie énormément l'exploitation. Mais il est vrai que cela peut ajouter un peu de complexité aux traitements.
    Et ce n'est pas toujours réalisable.

    En ce qui concerne Datastage, je n'ai jamais mis en place de traitement avec reprise suite à un plantage. Il me semble qu'il existe une fonction pour gérer ça (mais je ne sais pas si elle est implémentée dans la 7.0).

    Nicolas

  3. #3
    Membre du Club
    Inscrit en
    Octobre 2006
    Messages
    122
    Détails du profil
    Informations forums :
    Inscription : Octobre 2006
    Messages : 122
    Points : 47
    Points
    47
    Par défaut
    STP DevNico peux-tu m'expliquer ce que tu entends par ré-entrant?

  4. #4
    Membre averti Avatar de eryk71
    Profil pro
    Inscrit en
    Novembre 2007
    Messages
    322
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2007
    Messages : 322
    Points : 323
    Points
    323
    Par défaut
    Bonjour,

    Lorsque je fais un developpement ETL, je fais un test pour voir si l'enregistrement que j'insère existe déjà. Si c'est le cas, soit il y a une mise à jour de l'existent soit je n'y touche pas. Les autres lignes sont insérées.
    Donc s'il y a un plantage, je relance l'alimentation, celui-ci insérera seulement les nouvelles lignes, il n y aura pas de doublons.

    Ensuite cela dépend de la politique d'alimentation.

  5. #5
    Membre éprouvé
    Homme Profil pro
    Architecte Décisionnel
    Inscrit en
    Février 2008
    Messages
    866
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 48
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte Décisionnel

    Informations forums :
    Inscription : Février 2008
    Messages : 866
    Points : 1 260
    Points
    1 260
    Par défaut
    Par ré-entrant, j'entends que le traitement peut-être relancé sans opération manuelle préalable.

    Par exemple, si le traitement plante au milieu, il suffit de corriger la cause du plantage, et de relancer le traitement (pas besoin de vidage de table, modification du lot de données en entrée, ...).

    De même, si on se rend compte par exemple que le fichier traité n'était pas correct, il suffit de relancer le traitement sur un fichier corrigé.

    Comme je le disais, cette mise en œuvre n'est pas toujours possible (pour des raisons de stratégie d'alim, ou de performances), mais c'est quand même un atout indéniable dans l'exploitation. (pas de manips manuelles qui sont sources de loupés, gain de temps dans les procédures de reprises de traitements, ...).

    Nicolas

Discussions similaires

  1. Réponses: 0
    Dernier message: 13/08/2009, 17h45
  2. [MySQL] Utilisation des fonctions des récupérations des données
    Par Konrad Florczak dans le forum PHP & Base de données
    Réponses: 4
    Dernier message: 27/10/2006, 15h17
  3. [VBA-A]Remplir une textbox avec des données de tables.
    Par cuicui08 dans le forum VBA Access
    Réponses: 1
    Dernier message: 24/03/2006, 10h28
  4. [SQL] - Table 1 fournit colone des donnes de table 2
    Par COlive dans le forum Langage SQL
    Réponses: 4
    Dernier message: 18/11/2005, 03h08
  5. sauvegarde des données des tables
    Par tomm dans le forum Bases de données
    Réponses: 18
    Dernier message: 27/04/2004, 21h29

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo