Bonjour,
Est ce qu'il y a un moyen d'extraire du text sur une zone spécifique (avec coordonnées) ?
Merci infiniment.
Version imprimable
Bonjour,
Est ce qu'il y a un moyen d'extraire du text sur une zone spécifique (avec coordonnées) ?
Merci infiniment.
Dans un pdf, il n'y a pas de notion de texte.
Une page pdf est composée d'un ensemble de Glyph (caractère, coordonnées en X Y) généralement ordonné en fonction des coordonnées.
Evidement, pas de caractère "blanc" pour séparer les mots, ni de CRLF pour séparer les lignes :aie:.
A ma connaisssance, les bibli pdf permettent d'accéder aux glyph et/ou d'obtenir tout le texte d'une page ou d'un doc.
Mais, Une bibli permettant d'extraire le texte d'une zone spécifique risque d'être difficile à trouver.
Pour l'accès au glyphs, tu peux essayer TallComponents PDFControls 2.0.
La version d'essai gratuite non limitée dans le temps de son prédecesseur PdfReader.net convenait pour cet objectif.
oups au temps pour moi, j'avais pas lu le titre... dsl