Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

+ Répondre à la discussion

Shell et commandes GNU

Discussion :

Suppression des caractères spéciaux

Sujet :

Shell et commandes GNU

Outils de la discussion
- Afficher une version imprimable
- S'abonner à cette discussion…
Affichage
- Choisir le mode linéaire
- Choisir le mode hybride
- Mode arborescent

Mode arborescent

Message précédent

Message précédent

Message suivant

Message suivant

27/08/2012, 12h17 #1
thibaud74

Membre confirmé

Inscrit en
Mars 2008
Messages
80
Détails du profil
Informations forums :
Inscription : Mars 2008
Messages : 80
Suppression des caractères spéciaux
Bonjour,

J'essaie de nettoyer des fichiers convertis avec pdftotext afin de les récupérer dans R (analyse statistique).
Pour cela, j'utilise la commande suivante :

Code : Sélectionner tout - Visualiser dans une fenêtre à part

1
2
cat corpus.txt | tr -cd '\11\12\15\40-\176\224-\237'

Les options du tr sont censé me supprimer mes caractères spéciaux, sauf les caractères ascii indiqués. Sauf que :
- je ne parviens pas à inclure les caractères supérieurs au code 237 ;
- des accents disparaissent
- certains caractères spéciaux subsistent si j'en crois R.

Ci-joint un extrait du texte (corpus) que je souhaite nettoyer.

Merci de l'aide,
Thibaud.

Fichiers attachés

corpus.zip (81,6 Ko, 291 affichages)
Répondre avec citation 0 0

+ Répondre à la discussion

TUTORIELS LINUX

« Discussion précédente | Discussion suivante »

Discussions similaires

Suppression des caractères spéciaux d'un fichier ou string
Par yashiro41281 dans le forum C++

Réponses: 3
Dernier message: 13/12/2014, 23h27
Suppression des caractères spéciaux avant une comparaison de chaines
Par Gold.strike dans le forum C#

Réponses: 13
Dernier message: 06/12/2011, 15h17
Suppression des caractères spéciaux
Par chebmo90 dans le forum Windows Forms

Réponses: 3
Dernier message: 30/06/2009, 16h44
[RegEx] Suppression des caractères spéciaux et nombres
Par kenny.kev dans le forum Langage

Réponses: 6
Dernier message: 03/03/2008, 17h53
Où trouver la liste des caractères spéciaux?
Par gamez dans le forum Langage

Réponses: 3
Dernier message: 19/08/2003, 18h54

Partager

Partager