IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Petit Script pour nettoyer un fichier Txt


Sujet :

Shell et commandes GNU

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Février 2010
    Messages
    570
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 570
    Points : 97
    Points
    97
    Par défaut Petit Script pour nettoyer un fichier Txt
    Bonjour,

    J'ai un fichier texte avec des caractères spéciaux (retour chariot un peu bizarre ...)
    Cf. le fichier joint, entre les mots début et fin et il y a plusieurs CR et un d'entre eux me pose pb, ca se voit bien avec un editeur un peu costaud type Sublime Text ou autre ...

    Est ce que quelqu'un connait un petit shelle script qui permettrait de virer ces caractères merd.... ou les remplacer par un espace ?

    Merci pour votre aide

    Thais

  2. #2
    Membre régulier
    Profil pro
    Inscrit en
    Février 2010
    Messages
    570
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 570
    Points : 97
    Points
    97
    Par défaut
    avec le fichier c'est mieux ...
    Fichiers attachés Fichiers attachés

  3. #3
    Expert éminent sénior Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 276
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 276
    Points : 12 717
    Points
    12 717
    Par défaut
    Bonjour,
    La regex qui remplace tous les controls (dans ton exemple, ^M et ^L )par un espace: s/[[:cntrl:]]/ /g.
    Fonctionne sous vim,sed,perl,...
    Cordialement.

  4. #4
    Membre régulier
    Profil pro
    Inscrit en
    Février 2010
    Messages
    570
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 570
    Points : 97
    Points
    97
    Par défaut
    Bonjour Disedorgue,

    Merci pour ton aide, mais est il possible de supprimer uniquement le ^M, dans ton exemple, ca me supprime vraiment tous les retour charriot et pas seulement ceux qui sont spéciaux

    Merci encore

    Thais

  5. #5
    Membre régulier
    Profil pro
    Inscrit en
    Février 2010
    Messages
    570
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2010
    Messages : 570
    Points : 97
    Points
    97
    Par défaut
    Ou alors remplacer par un retour chariot classique ?

  6. #6
    Expert éminent sénior Avatar de disedorgue
    Homme Profil pro
    Ingénieur intégration
    Inscrit en
    Décembre 2012
    Messages
    4 276
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Ingénieur intégration
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Décembre 2012
    Messages : 4 276
    Points : 12 717
    Points
    12 717
    Par défaut
    Je ne comprend pas la question, tu utilise quoi comme commande pour supprimer les caractères spéciaux ?

    Le ^M est le retour à la ligne de MAC ou une partie du retour à la ligne de windows, pour unix, il n'en fait pas partie pas.
    Cordialement.

  7. #7
    Expert éminent

    Profil pro
    Inscrit en
    Janvier 2011
    Messages
    1 946
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Janvier 2011
    Messages : 1 946
    Points : 6 276
    Points
    6 276
    Par défaut
    Salut,

    Pour supprimer tous les ^M (\x0D) et remplacer tous les ^L (\x0C) par un espace : sed 's/\x0D//g;s/\x0C/ /g'.

    $ man woman
    Il n'y a pas de page de manuel pour woman.

  8. #8
    Expert confirmé
    Homme Profil pro
    Développeur informatique en retraite
    Inscrit en
    Avril 2008
    Messages
    2 101
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Côtes d'Armor (Bretagne)

    Informations professionnelles :
    Activité : Développeur informatique en retraite

    Informations forums :
    Inscription : Avril 2008
    Messages : 2 101
    Points : 5 849
    Points
    5 849
    Par défaut
    Citation Envoyé par thais781 Voir le message
    avec le fichier c'est mieux ...
    Voici le contenu de ton fichier, vu avec "od -c":
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    $ od -c Test.txt 
    0000000    D   e   b   u   t  \r  \r  \r  \r  \f  \r  \r  \r  \r   F   i
    0000020    n                                                            
    0000021
    Donc, on peut interpréter ce qu'il contient comme suit:
    D e b u t \r" : ligne contenant "Debut" et terminée par un ^M (ascii 13), encore appelé "carriage return" (d'où la notation "\r") et caractéristique d'un (ancien) fichier macintosh (Mac OS 9).
    \r \r \r : 3 lignes vides au format macintosh (ne contenant qu'un ^M)
    \f : une ligne ne contenant qu'un ^L (ascii 12), encore appelé "form feed" (d'où la notation "\f") et indiquant (à l'ancienne) un saut de page.
    \r \r \r \r : 4 lignes vides (format mac os 9)
    F i n : une ligne incomplète contenant "Fin" et non terminée par une fin de ligne.

    Dans ton cas, tu veux peut-être seulement supprimer les ^L et remplacer le ^M par des ^J (ascii 10), encore appelé "line feed" et caractéristique des fichiers au format Unix (linux, Mac OSX, Solaris, AIX, HP-UX, etc.):
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    $ cat Test.txt | tr -d '\f' | tr '\r' '\n' | od -c
    0000000    D   e   b   u   t  \n  \n  \n  \n  \n  \n  \n  \n   F   i   n
    0000020
    PS: cette méthode marche même sur un mac (sous OSX) où le "sed" d'origine n'est pas aussi puissant que le "sed" de GNU/linux et supporte mal les solutions proposées

    Mais tu peux aussi ouvrir le fichier avec "Sublime Text" et changer l'encodage des fins de lignes (menu View > Line endings > Unix) et supprimer le "FF" de la ligne 5 à la main.

  9. #9
    Expert éminent Avatar de BufferBob
    Profil pro
    responsable R&D vidage de truites
    Inscrit en
    Novembre 2010
    Messages
    3 035
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations professionnelles :
    Activité : responsable R&D vidage de truites

    Informations forums :
    Inscription : Novembre 2010
    Messages : 3 035
    Points : 8 400
    Points
    8 400
    Par défaut
    salut,

    dans la continuité de ce qui était proposé un peu plus haut :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    $ sed -r 's/[[:cntrl:]]+/\n/g' Test.txt | od -c
    0000000   D   e   b   u   t  \n   F   i   n

Discussions similaires

  1. Script pour lister les fichiers txt
    Par Arnaud62 dans le forum Programmation et administration système
    Réponses: 2
    Dernier message: 30/12/2011, 14h56
  2. Script shell pour parser un fichier txt
    Par pcsystemd dans le forum Shell et commandes GNU
    Réponses: 2
    Dernier message: 30/09/2008, 09h32
  3. un batch DOS pour "nettoyer des fichiers" ?
    Par RoroMinator dans le forum Scripts/Batch
    Réponses: 9
    Dernier message: 12/02/2004, 16h24

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo