Les messages d’un forum sont organisés par fil de discussion correspondant à un ensemble de messages
répondant à une demande originelle. Un fil de discussion se distingue par un intitulé, chaque message
d’un fil étant essentiellement identifié par son auteur et sa date de rédaction.
Vous trouverez sur Madoc une archive contenant une sélection des messages postés sur le forum Usenet
fr.comp.algorithmes depuis janvier 2005. Cette archive comporte des balises permettant de faire ressortir
les 2981 messages, répartis en 383 fils et échangés par 489 auteurs, qu’elle comporte. Prenez connaissance
de ces balises et familiarisez-vous avec la structure de ce document. Une étape de votre travail consistera
à écrire un analyseur syntaxique capable d’extraire chaque message d’un tel fichier.
Partager