Bonjour à tous! et Joyeux Noël !

je sais pas si c'est le bon forum pour mon sujet mais bon je vais m'y lancer.

Dans le cadre de l'utilisation du logiciel Flex pour la compilation, j'ai un fichier html, et je dois récupérer les références distantes qui sont dans les balises après les attributs href et src.

Je sais pas comment faire vu que je suis novice dans l'utilisation de Flex, je vous serai reconnaissant de m'aider.

Voilà le code html :

Code html : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
<html  xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr">
<head>
<title> Enseignements </title>	
</head>
<body>
<div id="entete">
    <img src="../photo.jpg" alt="photo" width="131" height="121" />
    <a HREF="http://www.lif.univ-mrs.fr">
         	<img id="lif" SRC="../shared/lif.gif" alt="Logo LIF" />
    </a>
</div>
<h1> Teaching </h1>
<div id="corps">
	<!--
    <h2> 3<sup>ième</sup> année de licence </h2>
    <p>
    -->
	<A href="https://tele.ctes.univ-provence.fr/moodle/course/view.php?id=179">
 		Compilation   
       	</A>
    </p>
    <a href="http://www.lif.univ-mrs.fr/~reyraud/">Retours</a>
</div>
</body>
</html>

Et voilà le code Flex que j'ai pu écrire, mais qui fait pas exactement ce que je veux :

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
%{
#include <stdio.h>
#include <stdlib.h>
int balise = 0;
%}
 
LETTRE		[A-Za-zéè]
CHIFFRE	 	[0-9] 
ESPACE		[ \t\n]
CARACTERES	!|_|-|\"|\'|\/|\.|=|\<|\>|:
CONTENU		{ESPACE}|{LETTRE}|{CHIFFRE}|{CARACTERES}
COMENTAIRE	<!--{CONTENU}+-->
BALISE          {<CONTENU>}+
ATTRIBU         HREF|href|src|SRC
 
%%
 
\<ATTRIBU			balise = 1;
\>			balise = 0;
[\n\t] 		 printf(" ");
[^<>]		 if(balise == 0){
					printf("%s",yytext);
			 }
{COMENTAIRE} ;
 
%%
 
int main(void) {
  	yylex();
  	printf("\n Analyse finie\n");
  	return -1;
}
Je vous remercie