IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Shell et commandes GNU Discussion :

Remplacé des caractères UTF8 erronés dans plusieurs fichiers


Sujet :

Shell et commandes GNU

  1. #1
    Membre à l'essai
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    12
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 12
    Points : 11
    Points
    11
    Par défaut Remplacé des caractères UTF8 erronés dans plusieurs fichiers
    Bonjour, j'ai rapidement écrit cette commande pour remplacer des caractères UTF8 mal convertis par phpdocumentor :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
     
    for file in $(find ~/www/public/. -type f); do
      sed 's/À/À/g' < $file > $file.tmp
      sed 's/É/É/g' < $file > $file.tmp
      sed 's/é/é/g' < $file > $file.tmp
      sed 's/è/è/g' < $file > $file.tmp
      sed 's/Ã/à/g' < $file > $file.tmp
      sed 's/ä/ä/g' < $file > $file.tmp
      sed 's/ë/ë/g' < $file > $file.tmp
      sed 's/ï/ï/g' < $file > $file.tmp
      sed 's/â/â/g' < $file > $file.tmp
      sed 's/ê/ê/g' < $file > $file.tmp
      echo $file
      rm -f $file
      mv $file.tmp $file
    done

    mais ça ne semble pas fonctionner. Quelqu'un pourrait me corriger ? (C'est le premier script shell de ma vie).

  2. #2
    Membre chevronné

    Profil pro
    Inscrit en
    Mars 2004
    Messages
    1 296
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Mars 2004
    Messages : 1 296
    Points : 1 803
    Points
    1 803
    Par défaut
    je ne pense pas que tu puisse t'en sortir avec sed, celui-ci utilise les tables de caractères courante , et donc "interprete".

    avec tr (man tr) cela devrait être probablement possible.

    sinon le traitement pourrait être réaliser directement avec un outils dedié comme :
    iconv
    Marc
    Slackware for ever ......
    BASH - KSH ( http://marcg.developpez.com/ksh/ )

  3. #3
    Membre éclairé Avatar de BlaireauOne
    Profil pro
    Inscrit en
    Mars 2007
    Messages
    492
    Détails du profil
    Informations personnelles :
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations forums :
    Inscription : Mars 2007
    Messages : 492
    Points : 652
    Points
    652
    Par défaut
    Citation Envoyé par evaisse
    Bonjour, j'ai rapidement écrit cette commande pour remplacer des caractères UTF8 mal convertis par phpdocumentor :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
     
    for file in $(find ~/www/public/. -type f); do
      sed 's/À/À/g' < $file > $file.tmp
      sed 's/É/É/g' < $file > $file.tmp
      sed 's/é/é/g' < $file > $file.tmp
      sed 's/è/è/g' < $file > $file.tmp
      sed 's/Ã/à/g' < $file > $file.tmp
      sed 's/ä/ä/g' < $file > $file.tmp
      sed 's/ë/ë/g' < $file > $file.tmp
      sed 's/ï/ï/g' < $file > $file.tmp
      sed 's/â/â/g' < $file > $file.tmp
      sed 's/ê/ê/g' < $file > $file.tmp
      echo $file
      rm -f $file
      mv $file.tmp $file
    done

    mais ça ne semble pas fonctionner. Quelqu'un pourrait me corriger ? (C'est le premier script shell de ma vie).


    Comme l'indique MarcG, tu peux utiliser iconv comme ceci :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
     
    for file in $(find ~/www/public/. -type f); do
      iconv -f utf-8 -t ISO-8859-1 $file > ${file}.tmp 
      echo $file
      rm -f $file
      mv ${file}.tmp $file
    done

    En tout cas, ton sed posait problème, format OK :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
     
    for file in $(find ~/www/public/. -type f); do
      sed -e 's/À/À/g' \
            -e  's/É/É/g' \
            -e 's/é/é/g' \
            -e  's/è/è/g' \
           (...)
            -e 's/ê/ê/g' < $file > $file.tmp
      echo $file
      rm -f $file
      mv $file.tmp $file
    done
    Loi de Murphy:
    La Théorie c'est quand ça ne marche pas mais que l'on sait pourquoi.
    La Pratique c'est quand ça marche mais qu'on ne sait pas pourquoi.
    Quand la théorie rejoint la pratique ça ne marche pas et on ne sait pas pourquoi.

Discussions similaires

  1. Rechercher/remplacer une chaine de caractères dans plusieurs fichiers
    Par _shuriken_ dans le forum Shell et commandes GNU
    Réponses: 5
    Dernier message: 31/07/2011, 20h06
  2. [Batch] Remplacer des caractères dans un fichier texte
    Par Benoit Labbey dans le forum Scripts/Batch
    Réponses: 2
    Dernier message: 09/06/2009, 16h43
  3. [RegEx] remplacer des données dans plusieurs fichiers
    Par sam01 dans le forum Langage
    Réponses: 3
    Dernier message: 11/12/2007, 14h03
  4. Réponses: 1
    Dernier message: 08/09/2006, 16h43
  5. Réponses: 3
    Dernier message: 27/06/2005, 16h24

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo