Bonjour

Je regarde actuellement les formats Apache Parquet / RCfile / ORC

Et je voulais savoir, pour faire un petit test, comment faire pour enregistrer une petit fichier sous un de ces formats (principes).
L'idée n'est pas de créer une base Hadoop... Mais juste comprendre comment manipuler des fichiers sous le format Apache Parquet en local (pas une base complexe, mais juste quelques infos).

Mais juste comprendre comment enregistrer sous un format linéaire sérialisé
Puis comment extraire les données en lecture.