Bonjour.

Je souhaite importer une table Oracle vers un système "BigData", au format parquet donc.
Pour l'importation j'utilise le composant tSqoopImport, tout se passe bien.

Problème : je souhaite vérifier que la table a été bien importée, et qu'il n'y a pas eu de corruption de données au passage.
J'avais pensé à un checksum, mais avec les histoires de format (de date, par exemple) je ne vois pas trop comment faire.
Le minimum serait de comparer le nombre d'enregistrements en BDD et dans le fichier parquet. Sauf que le format parquet ne donne pas une ligne=un enregistrement.

J'ai cherché un peu partout mais je n'ai pas trouvé de méthode pour valider, pourtant ça me semble (au moins sur le principe) assez trivial.
Quelqu'un aurait une piste ?

Merci d'avance.