IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Python Discussion :

lecture fichiers pdf [Python 3.X]


Sujet :

Python

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Invité
    Invité(e)
    Par défaut lecture fichiers pdf
    Salut la communauté,

    J'ai un soucis de lecture de certains fichier PDF.

    Ils sont tous en "texte" mais certains restent illisible.

    Serait-ce un soucis d'encodage ?
    Je rajoute bien la ligne en haut de mon fichier, en vain.

    Auriez-vous un conseil à me donner, s'il vous plaît ?

    Merci.

  2. #2
    Membre prolifique
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 830
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 830
    Billets dans le blog
    1
    Par défaut
    Bonjour
    Citation Envoyé par Collins75 Voir le message
    J'ai un soucis de lecture de certains fichier PDF.
    Ils sont tous en "texte" mais certains restent illisible.
    Cette phrase ne veut absolument rien dire, un fichier pdf n'est justement pas un fichier texte !!!

    Citation Envoyé par Collins75 Voir le message
    Auriez-vous un conseil à me donner, s'il vous plaît ?
    Montrer ton code, on n'est pas voyants !!!

    Citation Envoyé par Collins75 Voir le message
    Je rajoute bien la ligne # -*-coding:Latin-1 -* en haut de mon fichier, en vain.
    Ca n'a absolument rien à voir. Cette ligne ne sert pas à décrire l'encodage des fichiers que ton code va traiter (d'autant plus qu'un code pourrait traiter plusieurs fichiers tous différents !!!), mais à décrire l'encodage du code lui-même (l'encodage des strings qui se trouvent dans ton code, comme par exemple print("ééé") qui diffèrera selon que ton code est encodé en ascii ou en utf-8). Et indiquer à Python que ton code est en ascii alors que l'utf8 est devenu un standard depuis au-moins 10 ans (tous les éditeurs, même le notepad de base de Windows, écrivent en utf-8 par défaut) ne va pas vraiment aider (le script est-il réellement encodé en ascii??? )...
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  3. #3
    Membre Expert
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Février 2003
    Messages
    1 603
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : Industrie

    Informations forums :
    Inscription : Février 2003
    Messages : 1 603
    Par défaut
    Citation Envoyé par Sve@r Voir le message
    Bonjour

    Cette phrase ne veut absolument rien dire, un fichier pdf n'est justement pas un fichier texte !!!
    Ce que le PO a voulu dire, c'est que ses fichiers PDF sont de type PDF Texte ou PDF caractères, sous-entendu qu'ils contiennent du texte qui peut être sélectionné et copié depuis l'appli affichant leur contenu. A l'inverse des PDF de type Images contenant eux aussi du texte, mais issu d'un scan d'images qui rend leur sélection inexploitable par copié/collé.

    Du coup, question au PO : normalement, un PDF Texte, on peut facilement en extraire le contenu. Si certains sont des PDF Image, là va falloir jouer de l'OCR dessus pour espérer récupérer tout ou partie du texte.

    Donc la question : êtes vous sûr d'avoir que des PDF de type Texte ?

    +1 pour voir votre code.

  4. #4
    Membre éclairé

    Inscrit en
    Novembre 2008
    Messages
    424
    Détails du profil
    Informations forums :
    Inscription : Novembre 2008
    Messages : 424
    Par défaut
    Dans tous les cas, les pdf se traitent avec des bibliothèques spécialisées et pas comme un fichier texte :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
     
    texte = open("fichier.pdf", "r").read()
    ça ne marche pas.

    Donc je suis assez d'accord avec sve@r (même si je trouve le ton inutilement agressif) : sans le code, on ne peut pas dire grand chose de plus.

  5. #5
    Membre prolifique
    Avatar de Sve@r
    Homme Profil pro
    Ingénieur développement logiciels
    Inscrit en
    Février 2006
    Messages
    12 830
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Oise (Picardie)

    Informations professionnelles :
    Activité : Ingénieur développement logiciels
    Secteur : Aéronautique - Marine - Espace - Armement

    Informations forums :
    Inscription : Février 2006
    Messages : 12 830
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par fatbob Voir le message
    (même si je trouve le ton inutilement agressif)
    Si le PO avait fait l'effort de commencer par se promener dans le forum, regarder ce qui se fait, comment les autres postent leurs demandes, bref l'effort de s'y intéresser au lieu d'y voir juste un "réservoir à questions" il aurait vu qu'on poste les codes qui posent souci.
    Si le PO, en oubliant cette première étape, que (je suis d'accord peu de personnes ne font), avait seulement réfléchi un minimum, il aurait conclu de lui-même que sans code on ne peut pas grand chose ; un peu comme ce sketche de Coluche où il refait un jeu télévisé avec des questions absurdes style "quel âge avait Rimbaud?" qui laissent le candidat complètement désemparé face à cette question sans repère. Donc autant ce sketche on l'écoute on se marre, autant si on se le subit sur un forum parce que le PO réfléchit que dalle on se marre beaucoup moins.
    Donc il ne fait ni l'un, ni l'autre, posant sa question sans réfléchir plus loin que le bout de son nez, préférant se décharger sur nous de ce travail. Alors quand on en arrive à devoir rappeler l'évidence il en sort en conséquence ce ton en retour qui n'est pas, comme tu le crois, "inutilement" mais justement "utilement" agressif. Pour lui rappeler que c'est à lui de se bouger et pas à nous. Et s'il (comme cela semble être le cas ici) préfère ne pas répondre ni revenir (parce que peut-être vexé ou autre) il ne va pas me manquer. Ce forum n'est pas là pour faire du social. En tout cas, moi je ne suis pas là pour en faire. Comme d'autres l'ont déjà fait remarquer, c'est un forum de professionnels et les débutants sont acceptés uniquement dans la mesure où ils montrent un minimum d'effort, ce qui n'a pas été le cas ici.
    Mon Tutoriel sur la programmation «Python»
    Mon Tutoriel sur la programmation «Shell»
    Sinon il y en a pleins d'autres. N'oubliez pas non plus les différentes faq disponibles sur ce site
    Et on poste ses codes entre balises [code] et [/code]

  6. #6
    Invité
    Invité(e)
    Par défaut
    oula, oula,

    On sent qu'il y en a un qui a pas eu sa dose de câlins étant jeune !

    Tu as bien raison Sve@r, ici c'est une zone pro, nous ne sommes pas sur Tik Tok. Alors retournes y pour y déverser ta colère. Tu es le cas typique du haineux qui cherche la moindre confrontation. A surveiller le moindre post, voir à aller espionner les profils des membres. Ta vie est si inintéressante que ça ?
    Si je n'ai pas mis de code, c'est tout simplement que je demandais une information et non que l'on fasse le job à ma place.
    Alors prend un Lexomil pour calmer ta frustration et laisse les gens cohabiter sur le forum et s'entraider.

    Je te prierai de ne plus à l'avenir, venir polluer mes post ?

    Concernant les autres membres qui ont eu la gentillesse de me répondre, merci.
    J'ai refait mon programme sur un autre poste (le mien est en panne.) et cela fonctionne. Peut-être n'ai-je pas installé ce qu'il fallait sur le mien.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 6
    Dernier message: 02/10/2014, 22h31
  2. Accelerer lecture fichier PDF
    Par mrboliboli dans le forum Entrée/Sortie
    Réponses: 1
    Dernier message: 25/03/2014, 09h23
  3. Lecture fichier PDF et extraction de données avec Java
    Par le_misterioso dans le forum Général Java
    Réponses: 2
    Dernier message: 03/04/2011, 01h32
  4. Lecture fichier pdf
    Par kkajout dans le forum Entrée/Sortie
    Réponses: 1
    Dernier message: 09/04/2008, 16h57

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo