Bonjour
Je travaille actuellement sur le développement d'un package ODI. En gros j'ai des données en entrée, je les traites et je les sauvegardes.
ici, mon entrée c'est un fichier texte de 5Go, ce fichier ressemble à ça:
il y a plusieurs millions de lignes pour chaque ID et oui pourquoi faire simple quand on peut faire compliqué.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7 IDLIBELLEDATEDEBDATEFIN 01TOTO2012010120120201 01TATA2012020120120301 02BOBO2012040120120501 02BABA2012050120120601 .. 09FOFO2013010120130201
Mon besoin et simple: pour que mes tests ODI soient rapides j'ai besoin de réduire le nombre de lignes à environ 10 par ID. je suis sur un PC sans droits admin mais j'ai remarqué que python est installé sur mon poste et je sais que python c'est pas mal pour la manipulation de fichiers. Par contre, le truc le plus poussé que j'ai fait en python c'est un "hello world".
Merci d'avance
Partager