IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

MATLAB Discussion :

comment lire des fichiers binaires hétérogènes sans boucle for ?


Sujet :

MATLAB

  1. #1
    Membre éprouvé
    Avatar de ol9245
    Homme Profil pro
    Chercheur
    Inscrit en
    Avril 2007
    Messages
    985
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Avril 2007
    Messages : 985
    Points : 1 158
    Points
    1 158
    Billets dans le blog
    1
    Par défaut comment lire des fichiers binaires hétérogènes sans boucle for ?
    Bonjour,

    Je dois lire 150000 fichier qui contiennent en tout une centaine de millions de lignes. ça ne fait "que" 10 giga-octets en tout mais Matlab mets presque 3 heures à tout lire !!!

    Explication : c'est à cause de la boucle for de la mort qui tue !

    En effet, je ne sais pas comment faire pour lire un fichier binaire en entier dans une seule instruction Matlab. A ma connaissance, ça a l'air possible avec les fichiers texte (fscanf) : fscanf sait lire plusieurs lignes de texte selon des formats hétéroclites et ranger les résultats dans un joli tableau. Par contre ça ne m'a pas l'air possible avec les fichier binaires (fread) : pour fread, on ne peut tout lire d'un coup que si le format est uniforme, ce qui n'est pas le cas des fichiers que j'ai à lire.

    Voilà le bout de code qui lit un de ces fichiers :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    fileID = fopen(fni, 'r') ;
    
    % file header. 2 integers = 8 bytes = number 2 and the number or pairs of points
    H = fread(fileID, 2, 'int32') ;
    n = H(2) ;
    L = zeros(n, 1) ;
    U = zeros(n, 5) ;
    
    % each record is 44 bytes : one integer followed by 5 doubles.
    for i=1:n ;
        L(i,:) = fread(fileID, 1, 'int32') ; % 4 bytes. is always 2
        U(i, :) = fread(fileID, 5, 'double') ; % +40. 5 double. first is always 1.0
    end
    fclose (fileID) ;
    je serais très reconnaissant à celui ou celle qui m'aidera à supprimer cette boucle là

    merci
    "La vraie grandeur se mesure par la liberté que vous donnez aux autres, et non par votre capacité à les contraindre de faire ce que vous voulez." Larry Wall, concepteur de Perl.

  2. #2
    Membre régulier
    Homme Profil pro
    Inscrit en
    Mars 2011
    Messages
    94
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Mars 2011
    Messages : 94
    Points : 122
    Points
    122
    Par défaut
    Coucou!!

    Et tu as essayé avec textscan ?

  3. #3
    Membre éprouvé
    Avatar de ol9245
    Homme Profil pro
    Chercheur
    Inscrit en
    Avril 2007
    Messages
    985
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Avril 2007
    Messages : 985
    Points : 1 158
    Points
    1 158
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par Boumbata Voir le message
    Coucou!!

    Et tu as essayé avec textscan ?
    textscan ne m'est pas d'une grande utilité.
    comme indiqué dans le titre du fil, ce sont des fichiers binaires.
    "La vraie grandeur se mesure par la liberté que vous donnez aux autres, et non par votre capacité à les contraindre de faire ce que vous voulez." Larry Wall, concepteur de Perl.

  4. #4
    Membre éprouvé
    Avatar de ol9245
    Homme Profil pro
    Chercheur
    Inscrit en
    Avril 2007
    Messages
    985
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Avril 2007
    Messages : 985
    Points : 1 158
    Points
    1 158
    Billets dans le blog
    1
    Par défaut
    ce que j'ai fait en attendant les conseils, c'est de lire le fichier dans un tampon mémoire comme un tableau de caractères. Puis je découpe le tableau (à la scie ) et je réinterprète chaque morceau avec typecast. Le code équivalent à celui posté au premier message est :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
                    % le header du fichier est lu normalement         
                    H = fread(fileID, 2, 'int32') ;
                    n = H(2) ;
                    % le reste en vrac
                    T=reshape(uint8(fread(fileID)),44,[]) ;
                    fclose (fileID) ;
                    % un petit coup de scie et on typecast
                    U = typecast(reshape(T(5:end, :), 1, []), 'double') ;
    Je suis toujours preneur d'une version moins bidouille si c'est possible : Matlab n'est pas nativement dédié aux amateurs de lignes de code incompréhensibles....
    "La vraie grandeur se mesure par la liberté que vous donnez aux autres, et non par votre capacité à les contraindre de faire ce que vous voulez." Larry Wall, concepteur de Perl.

  5. #5
    Rédacteur/Modérateur

    Avatar de Jerome Briot
    Homme Profil pro
    Freelance mécatronique - Conseil, conception et formation
    Inscrit en
    Novembre 2006
    Messages
    20 302
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Freelance mécatronique - Conseil, conception et formation

    Informations forums :
    Inscription : Novembre 2006
    Messages : 20 302
    Points : 52 884
    Points
    52 884
    Par défaut
    Citation Envoyé par ol9245 Voir le message
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    T=reshape(uint8(fread(fileID)),44,[]) ;
    Mouais... bof, plutôt :


    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    T = fread(fileID,[44,inf],'uint8');
    Sinon, essaie ceci :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    fid = fopen('test.bin','r');
     
    H = fread(fid,2,'int32');
     
    L = fread(fid,[H(2),1],'int32',8*5);
     
    U = zeros(H(2), 5) ;
     
    fseek(fid,2*4+4,'bof');
    U(:,1) = fread(fid,'double',4*8+4);
    fseek(fid,2*4+4+8,'bof');
    U(:,2) = fread(fid,'double',4*8+4);
    fseek(fid,2*4+4+2*8,'bof');
    U(:,3) = fread(fid,'double',4*8+4);
    fseek(fid,2*4+4+3*8,'bof');
    U(:,4) = fread(fid,'double',4*8+4);
    fseek(fid,2*4+4+4*8,'bof');
    U(:,5) = fread(fid,'double',4*8+4);
     
    fclose(fid);
    ou encore plus simplement :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    fid = fopen('test.bin','r');
     
    H = fread(fid,2,'int32');
     
    L = fread(fid,[H(2),1],'int32',8*5);
     
    fseek(fid,2*4+4,'bof');
     
    U = fread(fid,[5,H(2)],'5*double',4).';
     
    fclose(fid);
    Ingénieur indépendant en mécatronique - Conseil, conception et formation
    • Conception mécanique (Autodesk Fusion 360)
    • Impression 3D (Ultimaker)
    • Développement informatique (Python, MATLAB, C)
    • Programmation de microcontrôleur (Microchip PIC, ESP32, Raspberry Pi, Arduino…)

    « J'étais le meilleur ami que le vieux Jim avait au monde. Il fallait choisir. J'ai réfléchi un moment, puis je me suis dit : "Tant pis ! J'irai en enfer" » (Saint Huck)

  6. #6
    Membre éprouvé
    Avatar de ol9245
    Homme Profil pro
    Chercheur
    Inscrit en
    Avril 2007
    Messages
    985
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 62
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Chercheur

    Informations forums :
    Inscription : Avril 2007
    Messages : 985
    Points : 1 158
    Points
    1 158
    Billets dans le blog
    1
    Par défaut
    Merci ++
    J'ai pris la deuxième version car en fait je n''utilises pas l'entier intercalé au milieu des doubles, donc je n'ai pas besoin de passer deux fois sur le fichier.
    "La vraie grandeur se mesure par la liberté que vous donnez aux autres, et non par votre capacité à les contraindre de faire ce que vous voulez." Larry Wall, concepteur de Perl.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Excel] Comment lire des fichiers excel avec php?
    Par dear_rihab dans le forum Bibliothèques et frameworks
    Réponses: 5
    Dernier message: 02/11/2007, 12h38
  2. Réponses: 11
    Dernier message: 02/11/2006, 16h50
  3. comment lire des fichiers binaires
    Par compton dans le forum Autres Logiciels
    Réponses: 8
    Dernier message: 06/07/2006, 12h03
  4. Comment lire des fichiers d'extension src ?
    Par compton dans le forum Applications et environnements graphiques
    Réponses: 5
    Dernier message: 04/07/2006, 16h37
  5. [Postgres]comment inserer des fichier binaires ?
    Par amin001 dans le forum PostgreSQL
    Réponses: 1
    Dernier message: 24/12/2005, 01h40

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo