Bonjour.
Donc, je dois extraire des informations (titre et auteurs) de publications scientifiques (au format pdf) pour les identifier d'après des bases de données en ligne.
Mais ...
- elles ne contiennent pas de métadonnées intéressantes pour cela
- la formalisation varie du tout au tout d'une publication à une autre suivant les magazines qui les publient et empêche donc l'extraction de données par des expressions régulières

La seule solution est pour moi de récupérer les lignes dont la taille de police est importante (elles contiennent souvent le titre et l'auteur) et de laisser l'utilisateur sélectionner parmi celle-ci le titre et le nom des auteurs.

Mon application étant en JAVA j'ai cherché une solution avec iText, sans succès jusqu'ici. Je ne trouve pas le moyen d'extraire la taille de police ligne par ligne.

Donc si qqun a une idée je suis preneur