Bonjour,
je cherche avec tesseract à faire de l'ocr sur un fichier tiff avec la commande:
seulement, j'ai cette erreur:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 cheminTesseract\tesseract.exe ficTiff.tif ficTxt.txt -l fra
Après recherches, il s'avère que mon tiff serait compressé et que tesseract ne prenne que les tiff non compressés. Je crée mon tiff à partir d'un pdf avec ghostscript avec la commande:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3 read_tif-image:Error:Illegal image format:Compression tesseract.exe:Error:Read of file failed:ficTif.tif
Je pense que pour créer un tiff non compressé, il faut modifier le -sDEVICE mais que mettre?
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2 "cheminGs\gswin32c.exe" -dNOPAUSE -dBATCH -dFirstPage=1 -dLastPage=1 -dTextAlphaBits=4 -r300 -sDEVICE=tiffg4 -sOutputFile=ficTif ficPdf
A moins que se ne soit le -r300 qui compresse en 300 dpi.
Quelle serait la commande pour créer un tiff non compressé à partir d'un pdf en passant par ghostscript?
Merci
edit: bon, j'ai modifié ma commande en retirant -r300 et en modifiant le -sDEVICE en tiffg3; je n'ai plus l'erreur mais j'obtiens le résultat en pièce jointe. Tesseract continue à tourner mais mon fichier txt n'existe toujours pas.
Comment résoudre ce problème?
Merci
Partager