Bonjour,
Je sollicite votre aide avant de me lancer dans un programme monstre, pour avoir votre avis, savoir s'il y a des méthodes plus simple pour arriver à ce que je souhaiterais.
J'ai récupéré une multitude d'articles de presse (au format pdf) que je dois traiter.
Je souhaite travailler sur Word, j'ai donc copié collé ces textes sur word et j'obtiens une version intéressante mais avec quelques défauts:
- des tirets de césure à chaque ligne
- des saut de ligne entre chaque ligne
----------------------------------
"Post hoc impie perpetratum quod in aliis quoque iam timebatur, tam-quam licentia crude8-
litati indulta per suspi-cionum nebulas aestimati quidam noxii damnabantur. quorum pars ne-
cati, alii puniti bonorum multa-tione actique laribus suis extorres nullo sibi relicto praeter que-
relas et lacrimas, stipe conlaticia victitabant, et civili iustoque imperio ad voluntatem converso
cruentam, claudebantur opu-lentae domus et clarae."
------------------------------------
et j'aimerais arriver à une version plus lisible comme la suivante.
----------------------------------------
"Post hoc impie perpetratum quod in aliis quoque iam timebatur, tam-quam licentia crudelitati indulta per suspi-cionum nebulas aestimati quidam noxii damnabantur. quorum pars necati, alii puniti bonorum multa-tione actique laribus suis extorres nullo sibi relicto praeter querelas et lacrimas, stipe conlaticia victitabant, et civili iustoque imperio ad voluntatem converso cruentam, claudebantur opu-lentae domus et clarae."
-----------------------------------------
Donc dans l'idée je me lancerai dans un programme vba capable:
- supprimer tous les tirets de césure mais pas les tirets des mots normaux (donc capable de faire la différence)
- supprimer les lignes vides entre deux lignes.
Qu'en pensez-vous? avez-vous des bouts de code qui vous viennent en tête?
J'avoue ne pas être très habitué avec le code vba sous word, plus expert avec excel.
Votre aide est la bienvenue
Merci par avance
Partager