IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

ALM Discussion :

Gestion d'une grande volumétrie de données


Sujet :

ALM

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Juin 2007
    Messages
    70
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2007
    Messages : 70
    Points : 53
    Points
    53
    Par défaut Gestion d'une grande volumétrie de données
    Bonjour,

    J'espère tout d'abord que mon sujet se situe dans la bonne partie.

    Dans le cadre d'un projet, je dois réfléchir à tout ce qu'il faut penser avant la mise en place d'une solution informatique avec une lourde volumétrie de données. J'ai identifié plusieurs points qui me semblent intéressants, et j'imerais que vous me donniez votre avis là dessus. Aussi, si vous pensez que j'oublie des choses, d'autres points auxquels il faut réfléchir avant de faire un choix de solutions, j'aimerais que vous m'en fassiez part.
    Voici les points que j'ai trouvés :
    • Stockage (fichier, BDD ..?)
    • Traitement des données (par ex traitements batch)
    • Structure des données (
    • Diffusion des données


    Pour chacun de ces points, je dois réfléchir aux coûts, à la technologie/le matériel à utiliser, s'ils possèdent différents critères qui permettent la fiabilité, l'intégrité, la sécurité des données.

    Voilà! J'aimerai avoir votre avis là dessus, ainsi que sur les critères de sélection

    Merci !

  2. #2
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    lourde volumétrie de données
    Lourde comment ?

    - Des milliards de lignes de bases de données ?
    - Des centaines de milliers de fichiers ?
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  3. #3
    Membre du Club
    Profil pro
    Inscrit en
    Juin 2007
    Messages
    70
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2007
    Messages : 70
    Points : 53
    Points
    53
    Par défaut
    Bonjour,

    En fait l'un puis l'autre dans mon cas (mais les données sont initialement fournies via des fichiers de millions de lignes), mais je voulais d'avantage avoir une vue d'ensemble sur ce qu'il est possible de faire, ou même ce qui me permettrait de choisir une solution plutôt qu'une autre.

    Comme je le disais, c'est plutôt des éléments de réflexion autour de la gestion d'une grande volumétrie que je recherche, des critères me permettant de faire des choix.

  4. #4
    Rédacteur/Modérateur
    Avatar de Logan Mauzaize
    Homme Profil pro
    Architecte technique
    Inscrit en
    Août 2005
    Messages
    2 894
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte technique
    Secteur : Transports

    Informations forums :
    Inscription : Août 2005
    Messages : 2 894
    Points : 7 083
    Points
    7 083
    Par défaut
    Des millions, des centaines de millions d'enregistrement, ca se gère dans un SGBDR.

    Après ca dépend ce que tu veux en faire.
    Java : Cours et tutoriels - FAQ - Java SE 8 API - Programmation concurrente
    Ceylon : Installation - Concepts de base - Typage - Appels et arguments

    ECM = Exemple(reproduit le problème) Complet (code compilable) Minimal (ne postez pas votre application !)
    Une solution vous convient ? N'oubliez pas le tag
    Signature par pitipoisson

  5. #5
    Membre du Club
    Profil pro
    Inscrit en
    Juin 2007
    Messages
    70
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2007
    Messages : 70
    Points : 53
    Points
    53
    Par défaut
    Oui, c'est une solution possible en ce qui concerne le stockage de données.
    Mais il n'y a pas que cet aspect qui m'intéresse, il y a aussi tout ce qui peut exister pour traiter, diffuser une grande quantité de données. Par exemple l'utilisation du batch processing ou de ce genre de chose. Comme je l'ai déjà évoqué, j'essaie de voir à quels niveaux une grosse volumétrie peut-elle engendrer comme impacts : au niveau du stockage donc, du traitement, de la diffusion... et je voulais savoir à quels autres niveaux il pouvait y avoir des impacts. Je suis d'accord que cela dépends de l'application, mais je voulais me détacher d'un contexte particulier, et voir un peu plus large.

  6. #6
    Rédacteur/Modérateur
    Avatar de Logan Mauzaize
    Homme Profil pro
    Architecte technique
    Inscrit en
    Août 2005
    Messages
    2 894
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 38
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Architecte technique
    Secteur : Transports

    Informations forums :
    Inscription : Août 2005
    Messages : 2 894
    Points : 7 083
    Points
    7 083
    Par défaut
    Pour le traitement, ca dépend vraiment de ce que tu veux en faire :
    • Traiter au fil de l'eau (pre/post-insertion) VS batch
    • Mise à jour VS création de nouveaux enregistrements
    • Transactionnel ou non

    Chaque choix différent à l'une de ces trois questions, impliquera nécessairement des solutions différentes.

    Pour la diffusion massive de données, le mieux c'est d'avoir un mode "compact" (ex : fichier unique compressé, ETL, etc.) Ou alors un mode "delta". Après la notion de diffusion peut prendre un autre aspect comme la réplication (ex : Oracle dataguard, MongoDB replicaset, ...).

    Je pense également qu'il manque la distinction entre traiter un grand volume et un grand débit.
    Java : Cours et tutoriels - FAQ - Java SE 8 API - Programmation concurrente
    Ceylon : Installation - Concepts de base - Typage - Appels et arguments

    ECM = Exemple(reproduit le problème) Complet (code compilable) Minimal (ne postez pas votre application !)
    Une solution vous convient ? N'oubliez pas le tag
    Signature par pitipoisson

  7. #7
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    Autre chose à considérer :
    - s'il s'agit d'un grand volume de données statiques (jamais mises à jour ou presque) et sans lien entre elles => voir du côté des outils big data nosql.
    - s'il y a un besoin d'intégrité référentielle entre les données avec des insertions et des mises à jour au fil de l'eau => SGBDR.

    Quant à la diffusion des données, la problématique sera différente - et les solutions techniques qui en découleront - s'il s'agit de diffuser une (relativement) petite quantité de données à un grand nombre d'utilisateurs potentiels simultanés ou s'il s'agit de diffuser un gros volume de données à chaque utilisateur, même si ces derniers sont peu nombreux.
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  8. #8
    Membre du Club
    Profil pro
    Inscrit en
    Juin 2007
    Messages
    70
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2007
    Messages : 70
    Points : 53
    Points
    53
    Par défaut
    C'est exactement le genre de réponse que j’attendais.

    Les points que vous avez relevés sont très intéressants et vont me permettre d'avancer, merci

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 11
    Dernier message: 23/09/2008, 15h39
  2. [Conception] Taille d'une grande base de données
    Par caranta0013 dans le forum PHP & Base de données
    Réponses: 22
    Dernier message: 28/03/2007, 09h43
  3. Une grande quantité de données sur Oracle 8i?
    Par bliml dans le forum Oracle
    Réponses: 13
    Dernier message: 01/03/2007, 11h45
  4. Réponses: 1
    Dernier message: 10/01/2007, 15h52
  5. Gestion d'une petite base de données
    Par vmal dans le forum Langage
    Réponses: 4
    Dernier message: 03/09/2006, 07h45

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo