[Kde Neon] Convertir fichier htm en pdf avec wkhtmltopdf et le securiser avec firejail
par
, 11/02/2021 à 13h01 (310 Affichages)
*
j'ai recupere une documentation disponible uniquement en ligne avec wget :
wget -r -k -np --user-agent=Firefox Adresse_Site
wkhtmltopdf m'a permis de convertir les fichiers htmls au format pdf (voir le script ci-dessous).
Voici les etapes pour ceux qui seraient interesses :
wkhtmltopdf a ete securise avec firejail. pas d'acces reseau et renforcement securitaire. pour plus d'informations, il est conseille de lire attentivement la documentation de firejail qui est tres bien faite...
- installer wkhtmltopdf :
la version disponible dans les depots n'est pas a jour et manque de certaines fonctionnalitees, il est preferable de recuperer la derniere version dans le site officiel et l'installer manuellement :
a cette date, la derniere version est la suivante :
wkhtmltox_0.12.6-1.focal_amd64.deb
installer :
sudo dpkg -i wkhtmltox_0.12.6-1.focal_amd64.deb
Ensuite se positionner dans le repertoire qui contient les fichiers htmls a convertir et lancer ce script :
htm2pdf
pour ameliorer modifier ce parametrage, voir la doc de wkhtmltopdf.
Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8 #!/bin/bash shopt -s nullglob for f in *.htm *.html do echo Traitement en cours de : "$f" firejail --noprofile --net=none --nogroups --private-dev --private-tmp --noroot --caps.drop=all --seccomp --nonewprivs wkhtmltopdf --enable-local-file-access --images --disable-internal-links --disable-external-links --no-custom-header-propagation --disable-javascript --disable-plugins --stop-slow-scripts "$f" "${f%.*}".pdf done
a noter que pour cette version, il faut ajouter l'option --enable-local-file-access sinon les images ne sont pas integrees au pdf...
conclusion : wkhtmltopdf est un programme tres performant. excellente qualite des fichiers generes...
la prochaine etape. joindre de nombreux fichiers pdf en un seul...