IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C++ Discussion :

Algo pour optimiser le stockage de donnéees


Sujet :

C++

  1. #1
    Nouveau membre du Club
    Homme Profil pro
    Inscrit en
    Juin 2007
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juin 2007
    Messages : 55
    Points : 27
    Points
    27
    Par défaut Algo pour optimiser le stockage de donnéees
    Bonjour,

    je ne sais pas à qui demander ça, alors je viens vous voir....

    Les supports physiques se dégradant assez vite, je voudrais renforcer la pérennité de stockage de mes données.

    Est ce que vous connaissez un algo (ou un programme) qui permette d'encoder avec les données, des bits de détection et surtout d'auto-correction comme cela existe avec certains protocoles de communication?

    Le must serait un algo qui tienne compte de la nature physique du support de stockage pour répartir les bits et réduire les risques de perte de données. Un dvd est par exemple sujet aux rayures et en vieillissant il doit certainement se dégrader statistiquement d'une manière qui lui est propre (par bloque de données contigües? par corruption sporadique de bit?)

  2. #2
    Expert éminent sénior
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Février 2005
    Messages
    5 073
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : France, Val de Marne (Île de France)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Conseil

    Informations forums :
    Inscription : Février 2005
    Messages : 5 073
    Points : 12 119
    Points
    12 119
    Par défaut
    Il y a le RAID et les backups. Cela n'a rien à voir avec de l'algorithmie.

  3. #3
    Nouveau membre du Club
    Homme Profil pro
    Inscrit en
    Juin 2007
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juin 2007
    Messages : 55
    Points : 27
    Points
    27
    Par défaut
    Le RAID et les backups permettent de multiplier les copies des données. C'est bien sûr le minimum à faire mais je voulais savoir s'il existe des outils/algo pour améliorer la pérennité du stockage que les données soit stockées sur un ou plusieurs supports.

    Je pensais surtout à un algo qui permettent de récupérer des données stockées sur un support qui commence naturellement à se dégrader au bout de x années.

  4. #4
    Membre éprouvé
    Inscrit en
    Avril 2005
    Messages
    1 110
    Détails du profil
    Informations forums :
    Inscription : Avril 2005
    Messages : 1 110
    Points : 937
    Points
    937
    Par défaut
    Outre les solutions hardware toutes faites ou manuelles (genre copie multiples sur diques vraiment pas chers de nos jours), tu voudrais faire ton propre protocole de copie/stockage/recup ?

    Perso je ne connais que hamming, qui agit octet par octet.
    Il existe sans doute d'autres type de codage agissant par paquet de grande taille, mais je ne connais pas. Pour ma culture ça m'interesserait aussi

  5. #5
    Nouveau membre du Club
    Homme Profil pro
    Inscrit en
    Juin 2007
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juin 2007
    Messages : 55
    Points : 27
    Points
    27
    Par défaut
    Je fais mes backup en raid 1, pas cher et efficace ... moi aussi c'était juste par curiosité.

  6. #6
    Membre éprouvé
    Inscrit en
    Avril 2005
    Messages
    1 110
    Détails du profil
    Informations forums :
    Inscription : Avril 2005
    Messages : 1 110
    Points : 937
    Points
    937
    Par défaut
    Citation Envoyé par winzzz Voir le message
    Le must serait un algo qui tienne compte de la nature physique du support de stockage pour répartir les bits et réduire les risques de perte de données. Un dvd est par exemple sujet aux rayures et en vieillissant il doit certainement se dégrader statistiquement d'une manière qui lui est propre (par bloque de données contigües? par corruption sporadique de bit?)
    Par ma petite expérience, j'ai pu constater qu'un DVD-R (ou CD-R) se dégrade globalement de manière assez brutale. Pas sûr qu'un algo puisse récupérer la dégradation de la couche sensible. Cette dégradation est plutôt du genre "large tâche" que "griffe étroite".

  7. #7
    Nouveau membre du Club
    Homme Profil pro
    Inscrit en
    Juin 2007
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juin 2007
    Messages : 55
    Points : 27
    Points
    27
    Par défaut
    On pourrait imaginer un algo dont on puisse régler le ratio entre le nombre de bits consacrés aux données à sauvegarder et le nombre de bits consacrés à l'auto-correction.

    Si le cout et l'encombrement du stockage sont négligeables par rapport à la valeur des données stockées, un ratio de par exemple, 80/20 nécessiterait 5 fois plus de dvd mais permettrait de sauver les données même sur des supports fortement dégradés.

  8. #8
    Expert éminent sénior
    Avatar de koala01
    Homme Profil pro
    aucun
    Inscrit en
    Octobre 2004
    Messages
    11 614
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : Belgique

    Informations professionnelles :
    Activité : aucun

    Informations forums :
    Inscription : Octobre 2004
    Messages : 11 614
    Points : 30 626
    Points
    30 626
    Par défaut
    Salut,

    Des algorithmes qui permettent de récupérer une partie des informations, il en existe énormément, mettant généralement en oeuvre des données "de parité", qui peuvent, simplement, être une comparaison ou exclusif des deux données précédentes.

    Cependant, lorsque le support physique de type "DVD" commence à se dégrader, tu ne t'en rend généralement compte que... beaucoup trop tard, lorsqu'il est déjà dégradé au point de ne plus profiter de la parité, parce que, effectivement, la dégradation s'étend sur plus "d'une partie" de la parité.

    Ceci dit, les supports plus résistants comme les disques durs externes sont de moins en moins cher (en terme de prix par Mb) et pourraient représenter une alternative:

    Tant que tu ne les soumets pas à un champs magnétique important, le seul danger est de l'ordre du moteur qui entraine les plateau et de l'axe qui les soutient... avec une résistance de plusieurs milliers d'heures d'utilisation.

    Tu gagnerais sans doute "sur tous les tableaux" à envisager cette alternative aux dvd:

    • Du point de vue de l'espace physique occupé par les supports, un disque dur actuel en demande très certainement moins que le nombre de DVD nécessaire pour préserver une quantité de donnée correspondante
    • Du point de vue du prix, le prix d'un Mb sur disque dur est, peu ou prou, de 1/5 du prix d'un Mb sur DVD
    • Du point de vue de la longévité, enfin, tu peux faire redémarrer un disque dur après plusieurs années sans avoir perdu le moindre byte de donnée
    A méditer: La solution la plus simple est toujours la moins compliquée
    Ce qui se conçoit bien s'énonce clairement, et les mots pour le dire vous viennent aisément. Nicolas Boileau
    Compiler Gcc sous windows avec MinGW
    Coder efficacement en C++ : dans les bacs le 17 février 2014
    mon tout nouveau blog

  9. #9
    Membre émérite
    Avatar de white_tentacle
    Profil pro
    Inscrit en
    Novembre 2008
    Messages
    1 505
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2008
    Messages : 1 505
    Points : 2 799
    Points
    2 799
    Par défaut
    Il y a quand même un point à prendre en compte aussi. Un dvd-r (ou +r, je ne suis pas sectaire, en tant que media worm (inscriptible une seule fois, lisible plusieurs) permet de faire de l'archivage légal, là où un disque dur, non.

  10. #10
    Expert éminent sénior
    Avatar de koala01
    Homme Profil pro
    aucun
    Inscrit en
    Octobre 2004
    Messages
    11 614
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : Belgique

    Informations professionnelles :
    Activité : aucun

    Informations forums :
    Inscription : Octobre 2004
    Messages : 11 614
    Points : 30 626
    Points
    30 626
    Par défaut
    Citation Envoyé par white_tentacle Voir le message
    Il y a quand même un point à prendre en compte aussi. Un dvd-r (ou +r, je ne suis pas sectaire, en tant que media worm (inscriptible une seule fois, lisible plusieurs) permet de faire de l'archivage légal, là où un disque dur, non.
    Ah, ca, je ne savais pas...

    Le problème, me semble-t-il, c'est que les archives légales doivent être maintenue 10 ans, non

    Comment être sur qu'un DVD, même s'il est correctement entreposé et n'est pas manipulé tiendra autant de temps

    Entre le froid, la lumière, la chaleur et l'humidité, il y a suffisamment de risques de le voir se détériorer bien avant ce délais
    A méditer: La solution la plus simple est toujours la moins compliquée
    Ce qui se conçoit bien s'énonce clairement, et les mots pour le dire vous viennent aisément. Nicolas Boileau
    Compiler Gcc sous windows avec MinGW
    Coder efficacement en C++ : dans les bacs le 17 février 2014
    mon tout nouveau blog

  11. #11
    Nouveau membre du Club
    Homme Profil pro
    Inscrit en
    Juin 2007
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juin 2007
    Messages : 55
    Points : 27
    Points
    27
    Par défaut
    koala01, tu as entièrement raison par rapport au choix de support. J'ai pris le DVD comme exemple car c'est un support particulièrement fragile. Même si un disque dur est plus fiable qu'un dvd, il ne sera jamais, lui non plus, totalement fiable.
    Ta réponse est évidement économiquement rationnelle mais j'insiste par curiosité : Ma question portait sur la manière d'agencer et de sécuriser les données d'une point de vue algorithmique avant de les écrire sur un support quelconque. pas sur les méthodes pour récupérer ce que l'on peut une fois que le mal est fait.

    white_tentacle, peux tu développer? Est que tu veux dire qu'un stockage sur dd n'est juridiquement pas légal alors qu'il l'est sur un dvd?

  12. #12
    Expert éminent sénior
    Avatar de koala01
    Homme Profil pro
    aucun
    Inscrit en
    Octobre 2004
    Messages
    11 614
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 52
    Localisation : Belgique

    Informations professionnelles :
    Activité : aucun

    Informations forums :
    Inscription : Octobre 2004
    Messages : 11 614
    Points : 30 626
    Points
    30 626
    Par défaut
    Citation Envoyé par winzzz Voir le message
    koala01, tu as entièrement raison par rapport au choix de support. J'ai pris le DVD comme exemple car c'est un support particulièrement fragile. Même si un disque dur est plus fiable qu'un dvd, il ne sera jamais, lui non plus, totalement fiable.
    Ta réponse est évidement économiquement rationnelle mais j'insiste par curiosité : Ma question portait sur la manière d'agencer et de sécuriser les données d'une point de vue algorithmique avant de les écrire sur un support quelconque. pas sur les méthodes pour récupérer ce que l'on peut une fois que le mal est fait.
    Au temps pour moi...

    Ben, l'algorithme le "plus simple" est sans doute le meilleur...

    Tu lis deux données de même taille (deux fois un byte ... c'est peut etre excessif) tu les écris, et tu ajoute une troisième donnée de même taille qui est... le ou exclusif des deux données lues...

    Tu te retrouve, fatalement, avec des donnée 1.5 fois plus importantes, mais, tu es alors en mesure de vérifier et de récupérer une donnée détériorée si les deux autres sont restées intactes: il te *suffit* de refaire un ou exclusif sur les deux données intactes pour récupérer la donnée détériorée
    white_tentacle, peux tu développer? Est que tu veux dire qu'un stockage sur dd n'est juridiquement pas légal alors qu'il l'est sur un dvd?
    Oui, c'est bien comme cela que je l'ai compris, et, à la réflexion, c'est tout à fait logique...

    Si tu fais du stockage sur dd, rien ne t'empêche de rebrancher le dd "en stoumelings" et d'aller y modifier les données, alors que, sur DVD (CD / blue ray, ne soyons pas sectaires), cela t'est impossible
    A méditer: La solution la plus simple est toujours la moins compliquée
    Ce qui se conçoit bien s'énonce clairement, et les mots pour le dire vous viennent aisément. Nicolas Boileau
    Compiler Gcc sous windows avec MinGW
    Coder efficacement en C++ : dans les bacs le 17 février 2014
    mon tout nouveau blog

  13. #13
    Membre éprouvé
    Inscrit en
    Avril 2005
    Messages
    1 110
    Détails du profil
    Informations forums :
    Inscription : Avril 2005
    Messages : 1 110
    Points : 937
    Points
    937
    Par défaut
    Surprenant. L'archivage sur bande magnétique est légal depuis longtemps, et c'est réinscriptible.

  14. #14
    Inactif  
    Avatar de Mac LAK
    Profil pro
    Inscrit en
    Octobre 2004
    Messages
    3 893
    Détails du profil
    Informations personnelles :
    Âge : 49
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Octobre 2004
    Messages : 3 893
    Points : 4 846
    Points
    4 846
    Par défaut
    Pour ce genre de choses, j'apprécie particulièrement d'utiliser QuickPar, avec les points suivants :
    • Nombre de blocs de récupération "énorme",
    • Taille des volumes le plus petit possible (=les plus nombreux possible).
    Ainsi, même si plusieurs fichiers sont illisibles, il est presque systématiquement possible de récupérer l'intégralité des données, tant que le support physique n'est pas totalement détruit.

    Après, tout passe par une bonne gestion des sauvegardes et de la duplication des données, mais au moins, tu évites les erreurs ponctuelles sur un fichier (ou pire, un bout de fichier !).

    Essaie sur un fichier quelconque chez toi, amuses-toi à supprimer des fichiers de l'archive au hasard et/ou à les endommager, tu verras que c'est assez impressionnant comme capacité de récupération.
    Mac LAK.
    ___________________________________________________
    Ne prenez pas la vie trop au sérieux, de toutes façons, vous n'en sortirez pas vivant.

    Sources et composants Delphi sur mon site, L'antre du Lak.
    Pas de question technique par MP : posez-la dans un nouveau sujet, sur le forum adéquat.

    Rejoignez-nous sur : Serveur de fichiers [NAS] Le Tableau de bord projets Le groupe de travail ICMO

  15. #15
    Nouveau membre du Club
    Homme Profil pro
    Inscrit en
    Juin 2007
    Messages
    55
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations forums :
    Inscription : Juin 2007
    Messages : 55
    Points : 27
    Points
    27
    Par défaut
    Surprenant. L'archivage sur bande magnétique est légal depuis longtemps, et c'est réinscriptible.
    camboui : il n'y avait peut être pas d'alternative à l'époque ... à part les cartes perforées.

    Merci koala01 & Mac LAK, vous m'avez donné les solutions algorithmiques ET logicielles que je cherchais, merci bcp!

  16. #16
    Membre émérite
    Avatar de white_tentacle
    Profil pro
    Inscrit en
    Novembre 2008
    Messages
    1 505
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2008
    Messages : 1 505
    Points : 2 799
    Points
    2 799
    Par défaut
    Citation Envoyé par camboui Voir le message
    Surprenant. L'archivage sur bande magnétique est légal depuis longtemps, et c'est réinscriptible.
    Je pense que tu confonds archivage et sauvegarde.

  17. #17
    Expert éminent sénior
    Avatar de Médinoc
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    27 369
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 27 369
    Points : 41 519
    Points
    41 519
    Par défaut
    @white_tentacle: J'allais le dire, je pense que vous ne parlez pas de la même légalité.
    • white_tentacle: Une archive sur DVD peut avoir une valeur légale, servir de preuve de quelque chose.
    • Les autres: Oui, on a le droit de mettre des trucs sur DVD.
    SVP, pas de questions techniques par MP. Surtout si je ne vous ai jamais parlé avant.

    "Aw, come on, who would be so stupid as to insert a cast to make an error go away without actually fixing the error?"
    Apparently everyone.
    -- Raymond Chen.
    Traduction obligatoire: "Oh, voyons, qui serait assez stupide pour mettre un cast pour faire disparaitre un message d'erreur sans vraiment corriger l'erreur?" - Apparemment, tout le monde. -- Raymond Chen.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 0
    Dernier message: 10/04/2013, 10h53
  2. [glut] vmanque d'inspiration pour optimiser
    Par khayyam90 dans le forum OpenGL
    Réponses: 7
    Dernier message: 01/09/2004, 13h41
  3. Algo pour écrire un chiffre
    Par Skyw4lKR dans le forum Algorithmes et structures de données
    Réponses: 5
    Dernier message: 11/08/2004, 13h32
  4. [DirectDraw] Que faire pour optimiser le rendu ???
    Par mat.M dans le forum DirectX
    Réponses: 8
    Dernier message: 12/12/2003, 18h02

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo