Robots libres [modifier]
* GNU Wget est un logiciel libre en ligne de commande écrit en C automatisant les transferts vers un client HTTP.
* Heritrix est le robot d'archivage de l'Internet Archive. Il a été écrit en Java.
* HTTrack est un logiciel aspirateur de site internet qui crée des miroirs des sites web pour une utilisation hors ligne. Il est distribué sous la licence GPL.
* Nutch est un robot de collecte écrit en Java et publié sous Licence Apache. Il peut être utilisé avec le projet Lucene de la fondation Apache.
Partager