Bonjour,
Je dois télécharger des fichiers pdf sur un site : tous les liens vers ces pdf sont sur une page htm en ligne.
Cette page, dont j'ai l'adresse est protégé par un fichier htacess (login + mdp) (que j'ai évidemment).
Comment parvenir à télécharger les pdf ?
(> récupérer la page htm protégée, trouver les liens vers les pdf ensuite parmi tous les liens, et les télécharger.
ce que je ne sais pas faire - aucun des 3-).
Je souhaite ensuite lire les pdf, je pense avec itext. Est-ce encore le meilleur (en libre) ? Je veux extraire une page pour mon app java : par ex la 1ere, sous forme
1) d'image
2) de texte, si c'en est.
Merci d'avance à tous.
Partager