Bonjour,
J'essaye de convertir le fichier PDF d'un ami en mode text.
J'utilise donc pdftotext.
Ca marche impeccable sauf pour ce fichier (cf. en PJ, par discrétion, je l'ai un peu purgé)
Il semblerait que le fichier pdf soit "codé"
Par exemple le mot "diplôme" semble être décomposé entre "diplô" et "me"
Savez-vous comment faire pour convertir ce fichier correctement ?
Faut il supprimer les caractères spéciaux du pdf avant ? si oui, comment ?
Merci pour vos lumières.
PS : Je post dans cette section puisque je cherche une solution de type shell pour faire cette conversion et/ou remove caractère spéciaux du pdf ....
Thais
Partager