Bonjour,
j'aimerais avoir de nouveau de l'aide pour un script bash que je dois rendre lundi sur lequel je bloque pour faire apparaitre les liens secondaires d'un site.
Pour rappel:
Ce script doit tester si un site internet (page principal et liens internes) est valide au sens du w3c (organisme qui valide les fichiers html, php d'un site internet).
il me reste ces 3 étapes a faire:
1 afficher les liens secondaires
2 la sortie du script doit afficher un compte rendu des pages valides et non valides avec w3c
3 dans l'affichage il faut un résumé de tout cela
mon script donne ceci:
#télécharger la page
#!/bin/bash
echo "Rentrer une adresse"
nomSite="http://users.info.unicaen.fr/~jmetivie/index.php/"
wget -O temp $nomSite
grep -e "<a href=\"[^>]*" -o temp>temp2 # lit par ligne en sélectionant les caractères
#Pour enlever le a href
cut -f2 -d '"' temp2 > temp3
#création dossier liens internes du site pour index.php
rm listsite
touch listsite
cat temp3 | grep -o -s .*".php" >> listsite # lire par ligne n'importe quel fichier .php
cat temp3 | grep -o -s .*".html" >> listsite # lire par ligne n'importe quel fichier .html
cat temp3 | grep -o -s .*".htm" >> listsite # lire par ligne n'importe quel fichier .html
#créer une boucle pour les autres liens du site
Merci d'avance
Cordialement,
Duboi
Partager