Bonjour,
Je vous expose mon problème :
je dispose de plusieurs fichiers (actuellement 33).
Je cherche à détecter les lignes en anomalies pour les corriger.
Toutes les lignes doivent faire 600 caractères de long et commencer par 3 lettres majuscule + $ (ex: ABC$ ou FYE$ ou FFF$)
La commandeme permet de détecter ces lignes.
Code : Sélectionner tout - Visualiser dans une fenêtre à part egrep -vn '^\w{3}\$*{596}' fichier
Elles m'affichent sous cette forme :
Je dispose d'un fichier avec une ligne en erreur, il fait 3,30 Go et contient 5 497 219 de lignes.
Code : Sélectionner tout - Visualiser dans une fenêtre à part nom_du_fichier:numero_de_ligne_en_erreur:contenu_de_la_ligne_en_erreur
Au total mes 33 fichiers font 37,24 Go pour 81 051 621 de lignes.
Je souhaiterai pouvoir "réparer" ces fichiers, c'est à dire que la ligne en erreur soit à la suite de la ligne qui la précède.
J'ai cherché pour supprimer les sauts de lignes qui ne seraient pas à la position 601, mais je ne m'en sorts pas
Des idées ?
Partager