Netcraft Web Server Survey a été lancé en août 1995 pour explorer Internet et trouver de nouveaux site Web. Chaque mois une requête HTTP est envoyée à chaque site pour déterminer quel serveur Web est utilisé pour ce site et par une inspection minutieuse des caractéristiques TCP/IP de la réponse le système d'exploitation.
Aux premiers jours du Web, les noms d'hôtes (comme
www.developpez.com par exemple) étaient une bonne indication sur les contenus fournissant des informations et des services aux Internautes que Netcraft appelle les « sites actifs ». Aujourd'hui la situation est devenue beaucoup plus floue, le web comprend toujours beaucoup de sites actifs, mais aussi une quantité considérable de sites web qui ne sont jamais visités par les Internautes. Ces sites sont produits automatiquement dès qu'un client achète un nom de domaine ou par les sociétés d'hébergement, des annonceurs ou des registrants de domaines à des fins spéculatives ou encore des sociétés optimisant les résultats donnés par les moteurs de recherche. Les plus importants registrants de domaines sont assez grands pour être important dans le contexte de l'enquête. Par exemple Go Dady avec, avec 17 millions d'hôtes, et 1&1, avec 10 millions d'hôtes, représentent 16 % des 168 millions de domaines interrogés en 2008.
Donc Netcraft a mis au point des algorithmes pour déterminer le nombre de site actifs. Par exemple imaginons que le site
http://www.developpez.com/ et
http://www.developpez.net/ affichent la même page web, alors Netcraft ne comptera qu'un seul site actif et non deux. D'autres algorithmes existent pour déterminer les sites actifs, je vous invite à lire la page
http://www.netcraft.com/active-sites/ pour plus de détails.
En résumé Microsoft IIS est surtout utilisé pour héberger des sites non actifs, par exemple pour afficher des pages du genre « Le nom de domaine masociete.com est réservé par ma société. », ce qu'on appelle des pages parkings. Microsoft a signé des accords avec des registrants de domaines pour héberger ces pages parkings, qui sont de simples pages statiques HTML, cela a permis à des millions de sites web de fonctionner sur Microsoft IIS et ainsi progresser dans l'enquête de Netcraft.
Partager