Précédent   Forum des professionnels en informatique > Java > Général Java > Langage > Autres
Autres Forum d'entraide pour les autres langages pour la JVM (AspectJ, Clojure, Duby, Fantom, Ioke, Jaskell, JRuby, Jython, Noop, Rhino, etc.)
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 31/01/2012, 11h36   #1
Invité de passage
 
Homme
Étudiant
Inscription : avril 2011
Messages : 8
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : avril 2011
Messages : 8
Points : 1
Points : 1
Par défaut Récupérer texte en gras, souligné des documents MS Office

Bonjour à tous ,

Je souhaiterais, via java, extraire le contenu de document MS office (word, ppt, excel ...). Cependant je souhaiterais extraire seulement les mots (ou phrases) soulignés ou en gras.

Je voudrais donc que vous m'éclaircissiez sur ce point. Est-ce possible ? Si oui quelle méthode (Librairies, API...) utiliser.

Merci à vous !

rafa69
rafa69 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 31/01/2012, 11h40   #2
Modérateur
 
Avatar de Robin56
 
Homme Nicolas
Ingénieur développement logiciels
Inscription : juin 2009
Messages : 1 714
Détails du profil
Informations personnelles :
Nom : Homme Nicolas
Localisation : France

Informations professionnelles :
Activité : Ingénieur développement logiciels

Informations forums :
Inscription : juin 2009
Messages : 1 714
Points : 4 840
Points : 4 840
Bonjour,

Je sais que Apache POI permet de gérer la lecture des fichiers Microsoft (Word, ...). Je ne l'ai par contre pas utilisé, je ne saurais t'en dire plus.
__________________
Robin56 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 01/02/2012, 10h59   #3
Invité de passage
 
Homme
Étudiant
Inscription : avril 2011
Messages : 8
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France

Informations professionnelles :
Activité : Étudiant

Informations forums :
Inscription : avril 2011
Messages : 8
Points : 1
Points : 1
Merci pour ta réponse

Cependant, Apache POI ne contient pas de méthode permettant de récupérer le texte en gras, souligné etc ...

Les seules méthodes disponibles (avec Apache POI) pour l'extraction de texte (sous Word) sont :

Code :
1
2
3
4
5
6
7
System.out.println("Footer text: " + wordExtractor.getFooterText());
                System.out.println("Header text: " + wordExtractor.getHeaderText());
                System.out.println(wordExtractor.getFootnoteText());
                System.out.println(wordExtractor.getEndnoteText());
                System.out.println(wordExtractor.getCommentsText());
                System.out.println(wordExtractor.getParagraphText());
                System.out.println(wordExtractor.getTextFromPieces());
Si je suis passé à coté de certaines fonctionnalité de la librairie Apache POI, ou si vous connaissez d'autres solutions, je vous en serais reconnaissant

rafa69
rafa69 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 07h14.


 
 
 
 
Partenaires

Hébergement Web