IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Composants VCL Delphi Discussion :

composants delphi convertion PDF,DOC,PPT .. en TXT ?


Sujet :

Composants VCL Delphi

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre expérimenté
    Profil pro
    Inscrit en
    Novembre 2007
    Messages
    150
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2007
    Messages : 150
    Par défaut composants delphi convertion PDF,DOC,PPT .. en TXT ?
    Bonjour à tous !

    Quelqu'un connait-il des composants Delphi (gratuits ou payants) qui permettent d'extraire le texte brut de divers formats de fichiers notamment PDF, DOC,DOCX,PPT,XLS ?

    Important:
    ----------

    * ces composants ne doivent pas nécessiter d'installer un autre logiciel (suite office, executable ou dlls) et ne doivent pas nécessiter de droits admin pour enregistrer un activex ou autre.

    * je ne veux pas d'une solution "serveur" (à moins que ça soit une extension PHP), je veux linker ça directement à un executable client

    A la rigueur je me contenterai d'une seule DLL qui fait tout si ça n'existe pas sous forme de composants.

    J'ai beau chercher grâce à notre ami googoo je ne trouve que des activex, des executables, des trucs qui dependent d'office, etc... je n'ai trouvé que pour du PDF seul mais il me faut les autres formats aussi.

    Merci !

  2. #2
    Expert éminent
    Avatar de ShaiLeTroll
    Homme Profil pro
    Développeur C++\Delphi
    Inscrit en
    Juillet 2006
    Messages
    14 096
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Développeur C++\Delphi
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juillet 2006
    Messages : 14 096
    Par défaut
    Pour Office, le plus simple étant OLE et la fonction Document.Save, tu peux lui indiquer le format
    Mais comme tu ne veux pas d'Office Installé, cela complique !

    Pour Excel, tu pourrais te débrouiller avec TMS FlexCell qui te permettrait de lire le fichier pour le convertir un fichier texte tabulé, FlexCell s'utilise a peu près comme les interfaces OLE d'Excel

    Pour RTF, un TRichEdit et PlainText

    J'aime bien ce type de question, je voudrais le "super méga objet qui tue" parce que j'ai pas du tout envie de le faire !

    A mon avis, tu trouveras autant de convertisseur qu'il y a de format, il y a des convertisseurs DOC vers RTF, cela pourrait t'aider aussi !

    Évidemment, tu es prêt à acheter composant ou outil ?
    Peut-être aussi Open Office, il est Open Source, ils doivent donc avoir le code pour les fichiers MSOffice !
    Aide via F1 - FAQ - Guide du développeur Delphi devant un problème - Pensez-y !
    Attention Troll Méchant !
    "Quand un homme a faim, mieux vaut lui apprendre à pêcher que de lui donner un poisson" Confucius
    Mieux vaut se taire et paraître idiot, Que l'ouvrir et de le confirmer !
    L'ignorance n'excuse pas la médiocrité !

    L'expérience, c'est le nom que chacun donne à ses erreurs. (Oscar Wilde)
    Il faut avoir le courage de se tromper et d'apprendre de ses erreurs

  3. #3
    Membre expérimenté
    Profil pro
    Inscrit en
    Novembre 2007
    Messages
    150
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2007
    Messages : 150
    Par défaut
    Je confirme que j'aime les choses simples, donc je n'ai aucune envie de dépendre d'office ou open office pour simplement extraire le texte brut d'un fichier (le but étant simplement d'indexer ensuite ce texte brut pour pouvoir faire des recherches sur le contenu dudit fichier).

    Quand à refaire soit même un composant, je serai ravi de parser directement en binaire les divers formats mais la plupart intègrent du contenu compressé et je n'ai pas les spécs détaillées.

    Et puis ça ne serait pas très efficient de réinventer la roue si il existe déjà quelques composants directement linkables pour faire ça, donc je suis prêt à payer si ça existe et que ça fonctionne.

    Même aller fouiller dans tout le code source d'open office ça peut prendre beaucoup de temps avant de trouver ce qu'il me faut et surtout le traduire en delphi.

  4. #4
    Membre éclairé Avatar de delagoutte
    Homme Profil pro
    Développeur informatique
    Inscrit en
    Septembre 2005
    Messages
    42
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Pyrénées Atlantiques (Aquitaine)

    Informations professionnelles :
    Activité : Développeur informatique
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2005
    Messages : 42
    Par défaut
    http://www.scalabium.com/
    Suite Ms word document
    pour les doc : TMSWordDocument
    marche plutot bien, il y a juste les entêtes et pied de page qui sont regroupé à la fin de l'extraction et non à leur place tel qu'à l'écran( en pratique c'est mieux comme ça plutot que si ils avait été à la place d'origine)
    pour les docx : TMSWordXDocument pas vraiment tester mais je pense que cela doit se comporter comme le TMSWordDocument .

    pour les pdf : TSMPDFReader, j'avais tester quand il commençait à le dévelloper et que le compo ne faisait pas encore vraiment partie de la suite msworddocument. une sorte de beta. résultat : c'était tout ou rien, soit j'avais bien tout le texte soit je n'avais rien. A retester donc.

    pour les ppt : TOpenOfficePresentation, Open office présentation ouvrant les ppt, ce compo permet peut être d'en extraire le texte


    pour les fichiers Xls, Xlsx c'est dans la suite SMImport suite que cela se passe, ce n'est pas directement extraction de texte mais tu as accés à tout les contenu de cellule, à toi de faire la boucle pour en faire une extraction texte.

    Tous ces compos annonce ne pas utiliser OLE et c'est réellement le cas, ils fonctionnent sans programme tiers.

    C'est payant mais le prix reste très raisonnable pour ce qu'il apporte.(avec version 30 jours pour tester)

  5. #5
    Expert éminent
    Avatar de ShaiLeTroll
    Homme Profil pro
    Développeur C++\Delphi
    Inscrit en
    Juillet 2006
    Messages
    14 096
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 44
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Développeur C++\Delphi
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juillet 2006
    Messages : 14 096
    Par défaut
    C'est même vraiment pas cher (à peine le coût d'une heure d'un presta !)
    Scalabium a noter dans les tablettes !
    Un partenaire dans un développement, justement utilisait les fichiers PDF que l'on générait avec ReportBuilder+InfoPower\WWRichEdit+ExtraDevices, j'ai du fouillé dans les options d'ExtraDevices pour trouver comment enregistrer la zone Memo en mode texte au sein du PDF, justement pour en extraire le contenu (envoyé par mail chiffré)
    C'est une problématique que l'on peut retrouver !

    Sinon pour l'indexation, tu veux concurrencer Copernic ? ! Bon courage !
    Aide via F1 - FAQ - Guide du développeur Delphi devant un problème - Pensez-y !
    Attention Troll Méchant !
    "Quand un homme a faim, mieux vaut lui apprendre à pêcher que de lui donner un poisson" Confucius
    Mieux vaut se taire et paraître idiot, Que l'ouvrir et de le confirmer !
    L'ignorance n'excuse pas la médiocrité !

    L'expérience, c'est le nom que chacun donne à ses erreurs. (Oscar Wilde)
    Il faut avoir le courage de se tromper et d'apprendre de ses erreurs

  6. #6
    Membre expérimenté
    Profil pro
    Inscrit en
    Novembre 2007
    Messages
    150
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2007
    Messages : 150
    Par défaut
    Ca m'a l'air prometteur ces petits composants
    Je ne connaissais pas.
    Je vais les contacter.

    Merci !

  7. #7
    Membre éprouvé Avatar de BuzzLeclaire
    Homme Profil pro
    Dev/For/Vte/Ass
    Inscrit en
    Août 2008
    Messages
    1 606
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Dev/For/Vte/Ass

    Informations forums :
    Inscription : Août 2008
    Messages : 1 606
    Par défaut
    Citation Envoyé par ShaiLeTroll Voir le message
    C'est même vraiment pas cher (à peine le coût d'une heure d'un presta !)
    Scalabium a noter dans les tablettes !
    Tu as raison la SMDbGrid est vraiment pas mal, je n'utilise que sa...


Discussions similaires

  1. Réponses: 4
    Dernier message: 08/08/2011, 12h48
  2. recherche composant de conversion de .doc, .xls ->pdf
    Par coucoucmoi dans le forum Composants VCL
    Réponses: 1
    Dernier message: 07/06/2010, 20h42
  3. convert PDF to PPT
    Par charouel dans le forum VB.NET
    Réponses: 0
    Dernier message: 30/07/2009, 10h59
  4. Convertion pdf en txt
    Par alex_95 dans le forum Macros et VBA Excel
    Réponses: 7
    Dernier message: 11/03/2008, 12h20
  5. Cherche doc DELPHI en pdf :)
    Par fantome_213 dans le forum Delphi
    Réponses: 3
    Dernier message: 16/11/2006, 16h51

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo