IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Programmation parallèle, calcul scientifique et de haute performance (HPC) Discussion :

Parallélisation de lecture de fichiers


Sujet :

Programmation parallèle, calcul scientifique et de haute performance (HPC)

  1. #1
    Futur Membre du Club
    Inscrit en
    Octobre 2009
    Messages
    6
    Détails du profil
    Informations forums :
    Inscription : Octobre 2009
    Messages : 6
    Points : 5
    Points
    5
    Par défaut Parallélisation de lecture de fichiers
    Bonjour tout le monde,

    Je travaille actuellement sur un projet qui consiste à générer des données à partir d'un ensemble de fichiers.

    Les données d'entrées sont des fichiers dont la taille peut atteindre le giga et ces fichiers peuvent assez être nombreux (une centaine, on va dire).


    Le process consiste à générer N fichiers de sortie, chacun de ce fichiers sera généré en allant chercher ses données dans le set de fichiers en entrée.

    Il faut donc parcourir les lignes de chaque fichier de sortie et aller chercher la bonne valeur dans le set d'entrée.

    Les données sont en partie localisées (les données proches dans le fichier output seront proches dans le fichier input), et le plus souvent pour un fichier de sortie, les donnée seront situées majoritairement dans un seul fichier d'entrée (mais ce ne sera pas toujours le cas ).


    Pour l'instant je fais ça séquentiellement en c++ avec du file mapping sur mes fichiers d'entrée.

    Mais j'aimerais optimiser le processus


    J'ai envisagé de multithreader mais j'ai peur que d'avoir plusieurs accès fichiers
    en même temps soit encore moins performant.

    D'où une première question, si je multithread, dois-je m'arranger pour que les thread lisent le même filemap ou bien au contraire qu'ils aillent chercher les infos dans différents filemap?

    Dans le 1er cas, je multithread au sein du traitement de fichiers de sortie assez proches, dans le 2eme cas je multithread sur des fichiers de sortie "éloignés" pour éviter que les thread lisent les mêmes fichiers d'entrée.


    Dois-je m'orienter vers des solutions GPGPU?

    De manière générale, j'aimerais avoir des opinions d'expert sur la bonne stratégie vers laquelle m'orienter...

    N'hésitez pas à me dire si mon explication du problème n'est pas assez claire et merci de votre aide!!

  2. #2
    Expert éminent sénior

    Profil pro
    Inscrit en
    Janvier 2007
    Messages
    10 603
    Détails du profil
    Informations personnelles :
    Âge : 66
    Localisation : France

    Informations forums :
    Inscription : Janvier 2007
    Messages : 10 603
    Points : 17 913
    Points
    17 913
    Billets dans le blog
    2
    Par défaut
    Bonjour

    d'abord, avant de poster, merci de lire et/ou


    Tu aurais trouvé, sur cette même page un peu plus bas :

    Optimisation lecture parallele de plusieurs fichiers
    "Un homme sage ne croit que la moitié de ce qu’il lit. Plus sage encore, il sait laquelle".

    Consultant indépendant.
    Architecture systèmes complexes. Programmation grosses applications critiques. Ergonomie.
    C, Fortran, XWindow/Motif, Java

    Je ne réponds pas aux MP techniques

Discussions similaires

  1. [Windows]lecture des fichier lnk (raccourcis)
    Par Tiaps dans le forum API standards et tierces
    Réponses: 10
    Dernier message: 21/10/2009, 19h27
  2. [jsp]lecture de fichier
    Par antigone dans le forum Servlets/JSP
    Réponses: 9
    Dernier message: 04/09/2003, 11h05
  3. [AS400][Intranet][PC] Lecture de "fichiers" AS400
    Par lando dans le forum Autres SGBD
    Réponses: 4
    Dernier message: 16/07/2003, 11h11
  4. Lecture de fichier
    Par Watcha dans le forum x86 16-bits
    Réponses: 13
    Dernier message: 04/03/2003, 20h43
  5. Lecture de fichiers ".WAV"...
    Par 0x4e84 dans le forum Langage
    Réponses: 2
    Dernier message: 03/09/2002, 09h43

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo