Je travaille sur un projet qui vise à numériser les textes de loi de façon à les rendre libre et facile d'accès au grand public. Etant donné que la documentation est sous le format texte(txt,rtf,doc,pdf), j'ais opté pour l'utilisation d' XML car il permet de structurer les textes.
Actuellement j'ais des problèmes pour :
- structurer les textes de loi pour en extraire la pertinence et
- corriger les erreurs en tous genres qui se sont glissés dans ces textes
J'ais pensé à concevoir un petit compilateur pour en venir à bout, mais pour l'heure, je plante!.
Je prie toute personne ayant la moindre idée de me faire signe.
Partager