1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70
|
import subprocess
import requests
from requests.exceptions import ConnectionError
def isurl(url_test) :
try:
response = requests.get(url)
response.raise_for_status()
return True
except requests.exceptions.HTTPError as err:
if err.response.status_code == 404:
print("404 Error")
return False
###############################################################################
############################### à modifier ####################################
###############################################################################
repertoire = ...
url_manuel = ...
nom_fichier_pdf = "...pdf"
###############################################################################
# si le nombre de pages dépasse 2000, changer le nombre
num_page = 1
while num_page < 2000:
url = url_manuel.format(num_page)
if isurl(url):
sortie = "page{}.pdf".format(num_page)
print(sortie)
subprocess.run(['wkhtmltopdf', url, sortie], cwd=repertoire)
num_page+=1
else:
break
nb_pages = num_page-1
######################### assemblage des pages ###################################
import PyPDF2
## création de la liste des pages à assembler
liste_pages = ["page{}.pdf".format(num_page) for num_page in range(1,nb_pages+1)]
# fonction d'assemblage
def pdf_combine(pdf_liste):
""" fonction d'assemblage des pages en pdf présentes
dans pdf_liste"""
merger = PyPDF2.PdfMerger()
for pdf in pdf_liste:
merger.append(pdf)
merger.write(nom_fichier_pdf)
# on assemble
pdf_combine(liste_pages)
import os
cpt=0 # compteur fichiers supprimés
######################### effacage des pages ###################################
# on efface les fichiers de toutes les pages pdf une fois combinées
# Parcours récursif des répertoires
for fichier in liste_pages:
# affiche les fichiers supprimés
print(fichier, ' supprimé')
# efface les fichiers
os.remove(fichier)
# incrémente le compteur de fichiers supprimés
cpt+=1
print(cpt, ' fichiers supprimé(s) !') |
Partager