Bonjour à tous,
je suis actuellement en train de réaliser un projet EN LANGAGE C (uniquement je précise pour ceux qui me conseillerait d'utiliser le PHP ça ne répond pas à mes attentes) me permettant de récupérer sur le web des liens qui m’intéresse pour les stocker sur un fichier et ne conserver que les meilleures après élimination du bruit.
Bref pour faire simple, j'utilise les sockets pour récupérer le code source d'une recherche google avec des paramètres constituant ma requête, jusque la tout fonctionne.
Je stocke donc dans un fichier texte tout le source de la première page google, et je voudrais ensuite conserver dans ce code uniquement les liens (une dizaine par page google), c'est à dire garder tout ce qui est contenu entre une balise href=" et " cependant je ne sais pas comment m'y prendre après avoir tout tenté durant des heures du fait que le contenu soit aléatoire.
Auriez vous une idée ? en PHP un regex m'aurait permis de faire cela en indiquant de garder tout ce qui est contenu entre href=" et " mais en C je bloque.
Merci d'avance, et bonne journée/nuit![]()
Partager