Bonjour,
pas du tout informaticien, je suis en train de m'initier à Perl très progressivement.
- J'ai obtenu par OCR la transcription d'un texte.jpg en un texte.txt.
- Très fidèle, mon logiciel a évidemment transcrit tous les tirets qui séparent les mots en fin de ligne pour justifier le texte.
- Avec Perl, j'aimerais effacer ces tirets de fin de ligne. Tant-pis, ce n'est pas grave si week-end devient weekend, le tout c'est qu'il enlève tout les tirets qui ralentissent sensiblement la lecture.
La solution provisoire que j'ai, et qui ne me convient pas, est celle ci:
Certes, il enlève tous les tirets en fin de ligne, mais en fait, il enlève surtout tous les retours \n. Comment puis-je faire pour qu'il change uniquement:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12 #!/usr/bin/perl open (F, "temp.txt") ; open (G, ">resu.txt"); while (<F>) {print ; chomp; s/- *$//g; print G; } close (F); close (G);
par:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2quan-\n tité
?
Code : Sélectionner tout - Visualiser dans une fenêtre à part quantité/n
J'espère avoir énoncé ma question clairement.
Merci d'avance pour votre aide.
Celano
Partager