IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

C# Discussion :

du binaire au PDF


Sujet :

C#

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre confirmé Avatar de lightbulb
    Homme Profil pro
    Inscrit en
    Septembre 2008
    Messages
    108
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : Septembre 2008
    Messages : 108
    Par défaut du binaire au PDF
    Bonjour à tous,
    Dans le cadre de mes études et plus simplement de ma formation personnelle je cherche à comprendre comment fonctionnent les encodages de caractères particuliers. (non ascii)

    Un fichier .pdf a forcément un code source qui sera alors interprété par le reader afin de mettre en page les informations. Lorsqu'on l'ouvre avec le BinaryReader et un char.ConvertFromUtf32(reader.ReadBytes()) le résultat est une suite de caractères incompréhensibles, ce n'est donc pas de l'ASCII.

    Quel est donc le type d'encodage utilisé par le pdf? Comment fait on à partir du binaire d'un fichier pour récupérer le source d'un fichier .pdf ?


    Merci

  2. #2
    Expert confirmé
    Avatar de smyley
    Profil pro
    Inscrit en
    Juin 2003
    Messages
    6 270
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2003
    Messages : 6 270
    Par défaut
    As tu déjà essayé d'ouvrir un fichier pdf avec notepad ? essayes de lire le fichier en utilisant l'encodage Default et tu aura le même résultat que notepad.

    Un pdf est simplement un fichier texte et dedans les objets sont incorporés tels quels. Par exemple, pour une image jpeg on vois dans le PDF à un certain moment l'entête du JPEG :
    ÿØÿà JFIF ...
    Sinon pour info :
    http://fr.wikipedia.org/wiki/Pdf
    http://fr.wikipedia.org/wiki/PostScript

  3. #3
    Membre confirmé Avatar de lightbulb
    Homme Profil pro
    Inscrit en
    Septembre 2008
    Messages
    108
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : Septembre 2008
    Messages : 108
    Par défaut
    L'encodage "Default" du bloc note revient exactement à traiter un fichier comme je l'ai fait avec le BinaryReader. On ouvre le fichier binaire, on lit par packet d'octet ce qui nous donne le code ASCII(int) du caractère que l'on retransforme en caractère compréhensible par l'homme grâce à convertFromUtf32 qui n'est rien de plus qu'un tableau bidimensionnelle avec d'un coté le code ASCII et de l'autre le caractère latin.

    Donc tous ces signes bizarres sont enfaite des images sous format texte. Le fichier est donc traitable en lui même.

    Je vais chercher comment transformer une image de format texte en une image tout court.

    Si vous avez des infos je suis preneur !

    Merci

  4. #4
    Expert confirmé
    Avatar de smyley
    Profil pro
    Inscrit en
    Juin 2003
    Messages
    6 270
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2003
    Messages : 6 270
    Par défaut
    Citation Envoyé par lightbulb Voir le message
    L'encodage "Default" du bloc note revient exactement à traiter un fichier comme je l'ai fait avec le BinaryReader.
    Non.
    En général ce que le bloc-notes t'affiches c'est ce qui est renvoyé par System.Text.Encoding.Default.GetChars(byte[]) car le BinaryReader lui ne lit que des bytes.
    Le plus du bloc notes c'est qu'il sait changer d'encodage s'il trouve que le fichier est en UTF8 ou Unicode, ou ...

    Citation Envoyé par lightbulb Voir le message
    Je vais chercher comment transformer une image de format texte en une image tout court.
    Hein ?
    Tu veux faire quoi exactement ?

  5. #5
    Membre confirmé Avatar de lightbulb
    Homme Profil pro
    Inscrit en
    Septembre 2008
    Messages
    108
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 37
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : Septembre 2008
    Messages : 108
    Par défaut
    Je cherche à comprendre comment fonctionnent les différents reader qui tournent sur le web. Comment font-ils pour transformer ce vieux format tout moche avec plein de symboles incompréhensibles en quelque chose de correct?

    La j'ai pris le pdf comme exemple. Mais pour changer prennons l'exemple du .msg format outlook.

    Comment tu passes de :

    à
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
     
    Received: from b0.ovh.net (HELO queue-out) (213.186.33.50)
    	by b0.ovh.net with SMTP; 26 Feb 2009 16:26:03 -0000

  6. #6
    Expert confirmé
    Avatar de smyley
    Profil pro
    Inscrit en
    Juin 2003
    Messages
    6 270
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juin 2003
    Messages : 6 270
    Par défaut
    Tu trouves toi qu'une image bitmap avec le notepad c'est plus joli ?
    On prend un exemple, l'image la plus basique qui soit : un header (deux int pour indiquer la taille) et ensuite chaque 3 bytes on a la couleur d'un pixel (RGB).
    Si tu t'amuses à faire ça, la vision "textuelle" de ton image sera infâme, mais à la sortie ton programme se contente de lire tous les 3 bytes afin d'assigner une couleur à un pixel et t'obtiens une image.
    Partant du même principe, le pdf est interprété : c'est un script qui sera exécuté par les reader et le script va placer les images, les couleurs, les lignes, le texte là où il le faut pour recréer la page d'origine.
    De ce fait, je ne vois pas du tout pourquoi tu t'obstines sur l'infâme texte du pdf vu que ce n'est pas censé être lu par un Homme mais par un programme.

    Idem, quand tu ouvres ... firefox on va dire ... avec le notepad firefox.exe c'est infâme. C'est pas humainement possible à partir de ça de savoir ce que le code va faire, c'est le pc qui s'en charge.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. convertir un tableau binaire to PDF
    Par sassou409 dans le forum EDI, CMS, Outils, Scripts et API
    Réponses: 1
    Dernier message: 23/07/2014, 09h11
  2. verifier si un mot existe dans un document pdf binaire
    Par karakz dans le forum Documents
    Réponses: 0
    Dernier message: 16/04/2010, 15h57
  3. Problème traduction fichier pdf binaire en héxa (0D 0A)
    Par identifiant_bidon dans le forum C++
    Réponses: 2
    Dernier message: 22/11/2007, 10h37
  4. Oracle et stock. fichiers binaires (img, pdf, doc..)
    Par romulus dans le forum Oracle
    Réponses: 12
    Dernier message: 29/06/2005, 16h05
  5. [CR] exporter en PDF
    Par Nathy dans le forum SAP Crystal Reports
    Réponses: 3
    Dernier message: 16/05/2002, 09h27

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo