retour de chariot : la raison
Alors je reviens vers vous pour savoir ce que vous pensez de mon code. J'ai créé un site (portfolio-production.com à la main (sublime text) pour une amie il y a un certain temps déjà. Il n'y a que très peu de pages et j'ai remarqué dès le début des requêtes sur des pages qui n'existent pas (du style /wpadmin /joomla /blogs etc). J'ai donc tout de suite créé un script qui m'envoie un mail avec la page, l'ip, la relevant url et le fournisseur d'accès.
Je n'ai gardé les mails que depuis août et il n'y a que quelques jours de ça après avoir installé Evolution j'ai créé un fichier MBOX et j'ai décidé de m'amuser avec grep, sed, cut, awk, tr, sort, uniq, rev et même od et file.
Le script nommé "extract" fait les choses suivantes :
- un fichier BLOCS qui me montre juste les lignes Date, Page, Referer, Ip et Fai quand elles ne sont pas vides (Referer et Fai),
- d'autres fichiers par genre montrant uniquement les lignes avec un sort | uniq et juste le domaine principal pour le FAI (pas le sous domaine).
- Ensuite c'est plus sérieux je crée un fichier TAB avec ces 3, 4 ou 5 lignes mises en colonnes, lignes triées par date.
Le code est accessible à cette adresse.
Merci de votre retour si vous avez le temps.