Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

  1. #1
    Chroniqueur Actualités
    Avatar de Patrick Ruiz
    Homme Profil pro
    Redacteur web
    Inscrit en
    février 2017
    Messages
    864
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Redacteur web
    Secteur : Communication - Médias

    Informations forums :
    Inscription : février 2017
    Messages : 864
    Points : 29 260
    Points
    29 260
    Par défaut Le 2 février 2020, GitHub va créer une image TAR de chaque dépôt public actif et la conserver au sein de l'ACV
    GitHub lance Arctic Code Vault, une initiative pour la sauvegarde du code open source mondial pour un millénaire
    Dans le cadre d’un vaste programme d’archivage

    L'idée de base de l'open source est d'écrire du code et de le partager pour donner à des tiers la possibilité de voir ce qui a été fait et, s'ils le souhaitent, de le prendre et de le modifier pour créer quelque chose de nouveau.

    GitHub est l'une des plateformes où la plupart des logiciels open source du monde sont développés. D'après les chiffres du dernier State of the Octoverse, environ 40 millions de personnes, dont un grand nombre de bénévoles, affinent les projets, consignent les bogues qui doivent être corrigés, recherchent les failles de sécurité et suivent les changements. Entre la publication de la dernière édition et celle qui la précède, la plateforme a vu la création de plus de 44 millions de dépôts. GitHub peut donc être considéré comme une gigantesque bibliothèque d'outils logiciels réutilisables. Et ce n’est pas la seule plateforme…

    Parler d’open source ne saurait se faire sans évoquer la problématique essentielle de stockage (ou de sauvegarde) sans laquelle les générations futures ne peuvent hériter desdits contenus. De la disquette 3 pouces et demi aux disques SSD, les durées de vie des supports de stockage s’étalent de dizaines d’années à tout au plus quelques centaines d’années.

    « Une part inquiétante du savoir mondial est aujourd'hui stockée sur des supports éphémères : disques durs, SSD, CD bons pour quelques décennies, bandes de sauvegarde dont la durée de vie théorique de 30 ans suppose une chaleur et une humidité strictement contrôlées », rappelle GitHub.

    C’est pour apporter sa contribution à la résolution de cette problématique et d’autres comme la survenue de catastrophes susceptibles de provoquer la perte des contenus que GitHub lance l’initiative Arctic Code Vault. L’information est tombée il y a peu en marge du lancement de l’édition 2019 de la conférence GitHub Universe qui s’achève ce jour.

    L’idée derrière l’initiative Arctic Code Vault est de sauvegarder les contenus des dépôts GitHub sur un support de stockage qui a une durée de vie plus importante.

    « Ces données seront stockées sur des bandes de film de 3 500 pieds, fournies et encodées par Piql, une société norvégienne spécialisée dans le stockage de données à très long terme. La technologie du film repose sur les halogénures d'argent et le polyester. Ce matériau a une durée de vie de 500 ans telle que mesurée par l'ISO. Des tests de vieillissement simulés indiquent que le film de Piql durera deux fois plus longtemps », indiquent les responsables de GitHub. La plateforme détenue par Microsoft prévoit de loger les bandes dans une mine de charbon déclassée à Svalbard, en Norvège. La même ville abrite une chambre froide mondiale. Il s'agit de l'une des villes situées le plus au septentrion de la planète. Les archivistes sont d’avis que le froid et les conditions presque constantes peuvent aider à la préservation des contenus.

    « Le 2 février 2020, nous allons procéder à une photographie de chaque dépôt public actif pour la sauvegarde au sein de ce coffre-fort », indiquent les responsables de la plateforme qui ont donné leur aval à la publication de contenus vidéo qui montre le déroulement d’une des opérations.


    Dans le cadre d’un partenariat avec Microsoft Research, le service web d'hébergement et de gestion de développement de logiciels entend prolonger la durée de préservation des contenus à 10 000 ans. « L’écriture des contenus se fera sur des plateaux en verre de quartz à l’aide d’un laser femtoseconde », précise GitHub.

    En fait, le GitHub Archive Vault fait partie d’un vaste programme d’archivage lancé par GitHub avec un certain nombre de partenaires parmi lesquels l’Internet Archive, Microsoft Research et la fondation Long Now.

    Nom : 9.png
Affichages : 20679
Taille : 145,4 Ko

    La stratégie se résume en une phrase : archiver les contenus au sein de multiples organisation selon la recommandation LOCKS – Lots Of Copies Keep Stuff Safe. Ci-dessous, le détail de la stratégie organisée en tiers hot (GitHub, GHTorrent), Warm (GH Archive, Internet Archive, Software Foundation Heritage), Cold (Bodleian Library, Arctic World Archive, Project Silica) :

    GitHub

    A chaque push, nous répliquons vos données Git vers de multiples centres de données à travers le monde. De plus, nous stockons des sauvegardes des données Git, des issues, des demandes d'extraction et de toutes vos données sur GitHub dans plusieurs emplacements. Toutes ces données sont disponibles en direct via l'API GitHub.

    GHTorrent

    GHTorrent surveille la chronologie des événements publics de GitHub, archive ces événements, et parcourt et archive récursivement leurs contenus et dépendances. Ces archives seront ensuite mises à disposition pour téléchargement sur une base quotidienne ou mensuelle.

    GH Archive

    GH Archive surveille la chronologie des événements publics GitHub, archive ces événements et les rend interrogeables à l'aide de BigQuery. Vous pouvez également télécharger des instantanés par heure, jour ou mois.

    Internet Archive

    La célèbre Wayback Machine de l'Internet Archive parcourra les dépôts publics de GitHub - y compris les nouveaux dépôts, les problèmes, les demandes d'extraction, les wikis et plus - et stockera des copies sur des disques durs à San Francisco et ailleurs. Ces archives seront accessibles au public via git et https.

    Software Heritage Foundation

    La Software Heritage Foundation explorera régulièrement GitHub et ajoutera ses rediffusions publiques à ses archives, auxquelles elle fournira un accès public à l'API.

    Bodleian Library

    La Bodleian Library de l'Université d'Oxford fournira une redondance pour l'Arctic Code Vault en conservant les 10 000 dépôts les plus étoilés et les plus dépendants de GitHub dans leur dépôt sous forme de bandes de film Piql en double.

    Source : GitHub Archive Program

    Et vous ?

    Que pensez-vous de cette initiative ?

    Voir aussi :

    Rachat de GitHub : pourquoi ce rachat, et quels sont les plans de Microsoft

    GitHub permet désormais de créer un nombre illimité de référentiels privés avec son offre gratuite et annonce une offre unifiée pour les entreprises

    À tous ceux qui ont fui GitHub suite au rachat par Microsoft : GitLab est hébergé sur Microsoft Azure
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  2. #2
    Membre actif
    Homme Profil pro
    Développeur Web
    Inscrit en
    juin 2013
    Messages
    63
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur Web
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : juin 2013
    Messages : 63
    Points : 258
    Points
    258
    Par défaut
    ... je vais faire plus attention à ce que je commit sur github moi ... j'imagine déjà la scène dans 10 000 ans :

    - Nous avons retrouvé des traces d'une très ancienne civilisation ! Après des années d'analyse nous avons enfin les résultats !
    - Et qu'est ce que ça dit ?
    - "console.log('prout');"

  3. #3
    Chroniqueur Actualités
    Avatar de Patrick Ruiz
    Homme Profil pro
    Redacteur web
    Inscrit en
    février 2017
    Messages
    864
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Cameroun

    Informations professionnelles :
    Activité : Redacteur web
    Secteur : Communication - Médias

    Informations forums :
    Inscription : février 2017
    Messages : 864
    Points : 29 260
    Points
    29 260
    Par défaut Le 2 février 2020, GitHub va créer une image TAR de chaque dépôt public actif et la conserver au sein de l'ACV
    Le 2 février 2020, GitHub va créer une image TAR de chaque dépôt public actif et la conserver au sein de l’Arctic Code Vault
    Un coffre-fort sous une montagne de l’Arctique

    Une part importante du savoir mondial est de nos jours stockée sur des supports éphémères : disques durs, SSD, CD bons pour quelques décennies, bandes de sauvegarde dont la durée de vie théorique de 30 ans suppose une chaleur et une humidité strictement contrôlées.

    GitHub veut apporter sa contribution à la résolution de cette problématique et d’autres comme la survenue de catastrophes susceptibles de provoquer la perte des contenus. Il ne faut en effet pas perdre de vue que c’est l’une des plateformes où la plupart des logiciels ouverts du monde sont développés. Elle revendique 40 millions de personnes dont un grand nombre de bénévoles qui affinent les projets, consignent les bogues qui doivent être corrigés, recherchent les failles de sécurité et suivent les changements. Entre la publication du dernier State of the Octoverse et celui qui le précède, la plateforme a vu la création de plus de 44 millions de dépôts. GitHub peut donc être considéré comme une gigantesque bibliothèque d'outils logiciels réutilisables, toute chose susceptible de justifier le lancement de l’initiative Artic Code Vault.

    L’idée derrière cette dernière est de sauvegarder les contenus des dépôts sur un support de stockage qui a une durée de vie plus importante. Piql, une société norvégienne spécialisée dans le stockage de données à très long terme, se charge de la fourniture et de l’encodage des données sur des bandes de film de 3500 pieds. La technologie du film repose sur les halogénures d'argent et le polyester. D’après les mesures de l’ISO, ce matériau a une durée de vie de 500 ans. Des tests de vieillissement simulés indiquent que le film de Piql durera deux fois plus longtemps, soit 1000 ans.

    Le service web d’hébergement et de gestion de développement de logiciels prévoit de loger les bandes dans une mine de charbon déclassée à Svalbard, en Norvège. La même ville abrite une chambre froide mondiale. Il s'agit de l'une des villes situées le plus au septentrion de la planète. Les archivistes sont d’avis que le froid et les conditions presque constantes vont contribuer de façon favorable à la préservation des contenus.

    Le 2 février 2020, GitHub va créer une image TAR de chaque dépôt public actif et la conserver au sein de l’Arctic Code Vault. L’archive inclura des éléments de la branche par défaut de chaque dépôt à l’exclusion de tout fichier binaire de plus de 100 kilooctets. Pour une plus grande densité et intégrité des données, la plupart des données seront stockées sous forme de code QR. Un index et un guide lisibles par l'homme détailleront l'emplacement de chaque dépôt et expliqueront comment récupérer les données.


    La plateforme compte ensuite multiplier la durée de sauvegarde des contenus par 10. GitHub a initié un partenariat avec Microsoft Research dans ce sens pour aller jusqu’à 10 000 ans. Pour y parvenir, les équipes de recherche entendent « écrire les contenus sur des plateaux en verre de quartz à l’aide de lasers femtoseconde. »

    Le GitHub Archive Vault fait partie d’un vaste programme d’archivage lancé par GitHub avec un certain nombre de partenaires parmi lesquels l’Internet Archive, Microsoft Research et la fondation Long Now. La stratégie se résume en une phrase : archiver les contenus au sein de multiples organisations selon la recommandation LOCKS – Lots Of Copies Keep Stuff Safe.

    Nom : 16.png
Affichages : 4356
Taille : 168,4 Ko

    La stratégie de sauvegarde est organisée en lots hot (GitHub, GHTorrent), Warm (GH Archive, Internet Archive, Software Foundation Heritage) et Cold (Bodleian Library, Arctic World Archive, Project Silica). Les lots hot feront l’objet de mises à jour en temps réel. Ainsi, au niveau de GitHub par exemple, les données feront immédiatement l’objet de transfert vers de multiples centres de données à travers le monde. Les lots warm seront mis à jour à une fréquence mensuelle ou annuelle. Enfin, le lot Cold dans lequel on retrouve l’Artic Code Vault fera l’objet de mises à jour tous les 5 ans à minima.

    GitHub Archive Program : une initiative pour la préservation des logiciels open source pour les générations futures

    « Notre mission première est de préserver les logiciels libres pour les générations futures. Nous avons également l'intention que le GitHub Archive Program soit un témoignage de l'importance de la communauté open source. Nous espérons qu'il permettra, aujourd'hui et à l'avenir, de mieux faire connaître le mouvement mondial de l'Open Source, qu'il contribuera à une plus grande adoption des politiques d'Open Source et d'Open Data dans le monde entier et qu'il encouragera la réflexion sur le long terme », écrit GitHub.

    Source : GAP

    Et vous ?

    Que pensez-vous de cette initiative ?

    Voir aussi :

    Rachat de GitHub : pourquoi ce rachat, et quels sont les plans de Microsoft

    GitHub permet désormais de créer un nombre illimité de référentiels privés avec son offre gratuite et annonce une offre unifiée pour les entreprises

    À tous ceux qui ont fui GitHub suite au rachat par Microsoft : GitLab est hébergé sur Microsoft Azure
    Contribuez au club : Corrections, suggestions, critiques, ... : Contactez le service news et Rédigez des actualités

  4. #4
    Nouveau Candidat au Club
    Homme Profil pro
    historien & product owner
    Inscrit en
    mai 2018
    Messages
    618
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 29
    Localisation : Algérie

    Informations professionnelles :
    Activité : historien & product owner

    Informations forums :
    Inscription : mai 2018
    Messages : 618
    Points : 0
    Points
    0
    Par défaut
    je vois pas l’intérêt...
    Je comprend l’intérêt de sauver les vieux programmes (jeux, logiciels...) en version finale (compilé et/ou avec le code source) pour en faire profiter les générations actuel/futur,

    mais par contre je vois pas l'interet de sauvegarder des projets qui évolue comme le kernel linux par exemple. l'industrie du logiciel évolue tellement vite qu'il me semble inutile de sauvegarder ce genre de projets.

    Qui a besoin d'un kernel linux 2.5.1 par exemple ?
    Y'en a qui s'amuse a ouvrir et a utiliser des projets PHP1, python1, activeX sous IE5.5 ? en générale on les recodes le plus vite possible et on s'en débarrasse.

    Le seul intérêt c'est pour des archéologeek de déterrer du vieux code comme on déterre une momie et l'exposer dans un musée mais certainement pas de réutiliser ce vieux code.

  5. #5
    Membre extrêmement actif Avatar de eldran64
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    janvier 2008
    Messages
    300
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 34
    Localisation : France, Ille et Vilaine (Bretagne)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : janvier 2008
    Messages : 300
    Points : 1 209
    Points
    1 209
    Par défaut
    Citation Envoyé par ShigruM Voir le message
    je vois pas l’intérêt...
    Il y a la fois un côté artistique (laisser une trace dans l'histoire) et un côté utilitariste. Effectivement les logiciels ne cessent de progresser et de se corriger régulièrement. Mais ça fera un excellent snapshot pour aider nos descendant à comprendre qui on était. Une sorte de capsule temporelle mais pour le code info.
    Tout le monde devrait avoir de l'esprit critique car personne ne pourra m'apporter la preuve de l'absence celui-ci

  6. #6
    Membre extrêmement actif
    Profil pro
    Développeur
    Inscrit en
    mars 2012
    Messages
    1 958
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations professionnelles :
    Activité : Développeur
    Secteur : Communication - Médias

    Informations forums :
    Inscription : mars 2012
    Messages : 1 958
    Points : 3 220
    Points
    3 220
    Par défaut
    Citation Envoyé par ShigruM Voir le message
    Qui a besoin d'un kernel linux 2.5.1 par exemple ?
    Ce n'est pas Qui mais Quoi.

    Pour retrouver des fonctionnalités...

    EDIT: faites un tour sur l'excellent archive.org, on retrouve des perles.
    Si la réponse vous a aidé, pensez à cliquer sur +1

Discussions similaires

  1. [Microdonnées] Schema.org : une initiative pour que les moteurs de recherche comprennent les sites Web
    Par dourouc05 dans le forum Web sémantique
    Réponses: 3
    Dernier message: 02/08/2011, 22h13
  2. Réponses: 52
    Dernier message: 09/03/2010, 11h42

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo