Bonjour,
J'essaie de trouver une discussion similaire mais sans succès, alors dans le doute, voici mon problème :
J'ai une bibliographie d'ouvrages et de revues sous word (.doc) qui se présente ainsi (cf lien) :
Nous l'avons temporairement migré en htm, donc vous pouvez la voir sur : http://www.gazettes18e.fr/bibliographieANGELIKE, Karin
—, « Louis-François Mettra et les débuts du Nouvelliste politique d’Allemagne. Réflexions sur la fonction socio-culturelle de l’ouvrage périodique à l’époque des Lumières », in B. Berglund-Nilsson (éd.), Nouvelles, gazettes, mémoires secrets (1785-1800), Karlstad U. Studies, 2000, p. 163-174
—, Louis-François Mettra. Ein französischer Zeitungsverleger in Köln (1770-1800), Köln, Bolhau, 2002, 497 p.
APPOLIS, Émile, « La collaboration de Soanen aux Nouvelles ecclésiastiques », Revue d’histoire de l’Église de France, 30:117, 1944, p. 96-99
ET il faudrait que je puisse exploiter la mise en forme sous word pour déterminer le type de chaque donnée: titre supérieur (en italique), inférieur (entre guillemets), auteur, lien http, couleur de la police, ...
Toutefois, je ne parviens pas à mettre en place une lecture ligne à ligne pour un document word.
Alors je suis passé par le format texte (.txt) mais je perd la mise en page, donc de l'information pour reconnaître certaines données.
Des idées?
Merci.
Partager