Bonjour à tous
Sous Linux, en UTF8, je me heurte régulièrement à une besogne encombrante: le codage d'espaces particuliers (avant ou après des signes de ponctuation) dans des documents MSWord.doc que j'exporte en fichier texte (avec abiword ou libreoffice)
Les messages des compilateurs LaTeX ou autres pdfLaTeX m'indiquent le plus souvent:
Utilisant vim comme éditeur, je ne sais pas comment repérer ces blancs codés en utf8 inconnus de LaTeX.
Code : Sélectionner tout - Visualiser dans une fenêtre à part Unicode char \u8 :* not set up for use with LaTeX
J'en suis réduit à rechercher les . , ; ,« ,!, ? etc. car ces blancs ne sont malheureusement pas constants ! (sinon il serait facile de les substituer dans tout le document, en une seule ligne de commande de vim (ou de sed, pour une série de fichiers de même origine)
Bref je ne sais pas trop s'il s'agit d'un problème de codage (utiliser un outil de conversion), de vim ou de sed (comment désigner ce caractère dans une commande de substitution ?), voire une question plus spécifiquement TeXienne.
Toujours est-il que mes collègues Windoziens me donnent beaucoup plus de travail avec ce «détail» qu'avec tous les choix et réglages de mise en forme et de typographie qu'ils me demandent !
Merci pour votre intérêt
PS Suggestion aux mainteneurs du forum: ne serait-il pas utile de créer une rubrique sur les problèmes d'interopérabilité et de codage, y compris l'UTF8 si insuffisamment universel ? Je pense aussi à ces fichiers doc que certains collègues ne parviennent pas à ouvrir ou à lire entre 2 versions différentes (je suppose !) de windows (je n'ai pas ce souci et leur sers parfois de relai !), ou bien à ces pdf "binhex" parfois pas ouvrables même sur certains mac.. (là encore j'ai vite trouvé le convertisseur sous Linux)
Partager