Bonjour à tous,
J'espère que votre rentrée se passe bien

J'ai une question toute bête mais qui me donne du fil à retordre, je m'explique:

Je copie 3 fichiers sur un serveur Hadoop grâce à la Proc Hadoop.
J'en ai systématiquement 1 sur les 3 (toujours le même chaque mois) qui ne me renvoi pas le bon nombre de lignes.
Je fais mon comptage sur le fichier CSV et sur le fichier recopié sur le serveur ---> et résultat : pas le même nombre de ligne des 2 cotés.

en mettant cette ligne plusieurs fois dans le code :
Code : Sélectionner tout - Visualiser dans une fenêtre à part
hdfs copyfromlocal="&chemin_sorties.\&fichierIn." out="&chemin_hdfs." overwrite;
j'arrive de façon aléatoire à avoir une copie identique des deux cotés.

Avez vous une idée d'où vient le problème ?

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
* Copie du fichier CSV du repertoire reseau sur le serveur Hadoop ;
proc hadoop username="&user." password="&mdp." verbose;
   hdfs mkdir="&chemin_hdfs.";
   hdfs delete="&chemin_sorties.\&fichierIn." nowarn;
   hdfs copyfromlocal="&chemin_sorties.\&fichierIn." out="&chemin_hdfs." overwrite;
/*   hdfs copyfromlocal="&chemin_sorties.\&fichierIn." out="&chemin_hdfs." overwrite;*/
run;
En vous remerciant