Bonjour,
Je dois faire une extraction assez similaire à ça mais à partir du plein texte d'une myriade de documents Word. Ne sachant que des bribes "codes" trrrèèès très rudimentaires(1) mais ayant un besoin professionnel immédiat, je souhaite recopier-tester du "prêt-à-encoder" le plus proche possible de mon besoin.
Exactement je dois extraire à partir du plein texte des strings possédant quelques repères quand même : non pas de vrais guillements mais des "<<" et ">>" entourant les morceaux de textes à extraire -- soit quelques dizaines jusqu'à quelques centaines de morceaux par fichier pour 5000 fichiers Word (*.docx).
Pour le très insuffisant que je connais, je pense/sais qu'il me faut une macro sur un classeur Excel qui crée une ligne par extraction en face du fichier Word d'où vient l'extrait (soit autant de lignes qu'il y a de "<<blablabla, blablabla...>>" dans l'ensemble des fichiers à fouiller, dont certains "strings" sont à la queue-leu-leu et d'autres disséminés dans d'autres paragraphes ou tableau du document Word). La raison de mon besoin est que je ne suis pas à l'origine de ces fichiers Word ainsi remplis parce qu'un autre logiciel fait des "fusions"/"insertions" à partir de ces "strings" et d'autres trucs (je ne suis pas programmeur donc je ne peux pas imposer qu'ils utilisent du vrai champ Word, etc). MAIS il faut que je répertorie l'intégralité de ces "strings" (qu'ils n'ont actuellement aucun moyen de requêter) car ils en ont besoin pour d'autres choses, notamment faire un suivi de quel fichier Word utilise/insert quelle donnée à partir de quel autre truc (en principe le contenu du string renseigne sur ça).
Je vous prie de croire que je ne peux pas solliciter les informaticiens de ma boîte puisqu'ils planchent déjà tous plus sur le développement du logiciel (pour lequel je n'effectue que des prestations en clientèle s'en tenant à how-to-use-it ou quelques demandes comme la présente lorsqu'un client n'a pas effectué un suivi un peu plus propre et se retrouve coincé dans certaines problématiques par manque d'un bon suivi de ses utilisations de notre logiciel). Nos informaticiens ont déjà assez de mal à débloquer un peu de temps pour dépanner nos propres portables quand il arrive des pépins, les pannes logicielles chez nos clients ayant priorité. De plus j'ai posé la question : notre database ne permet pas d'effectuer la requête de mes rêves pour obtenir l'extraction demandée par le client.
Je remercie d'avance les bonnes âmes qui viendront à mon secours et leur promets ma gratitude éternelleUn jour, si je redeviens chômeuse, j'apprendrai peut-être à faire plus que quelques bases un peu chiadées sous Access, mais j'ai vraiement besoin d'aide plus que de remontrances -- le client me demande même de "faire manuellement" si jamais je n'ai pas d'autre solution pour répertorier tous ces "string"
![]()
Bien à vous
_______________
(1) : Je connais un peu de SQL (requêtes) et j'ai un jour appris à écrire (papier) des algorithmes rudimentaires, mais je ne parle aucun langage informatique. A la limite je sais créer des bases de données (Access, Excel).
Partager