Bonjour, j'aimerai via un programme Java récupérer la taille d'une page html, j'entend par la la bande passante qu'elle consomme sur le serveur.
En gros il faudrait pouvoir calculer la tailles du texte et des images qu'elle contient.
Merci d'avance
Bonjour, j'aimerai via un programme Java récupérer la taille d'une page html, j'entend par la la bande passante qu'elle consomme sur le serveur.
En gros il faudrait pouvoir calculer la tailles du texte et des images qu'elle contient.
Merci d'avance
heu, pour la bande passante t'aurait pas besoin d'un référenteil de temps aussi ?
et du coup scanner directement le port 80 ?
la bande passante sera differente selon le temps, s'il te faut 10 minutes pour telecharger la page que s'il t en faut 1..., dans le deuxieme cas, la bande passante sera plus grande.
Ok, mais cela ne me dit pas comment faire...
j'ouvre un socket sur le port 80 et je lis tous ce qui y transite, c'est ca à quoi tu pense ?
en fait je cherche à faire exactement ce que fait cette page... mais en java...
http://www.websiteoptimization.com/services/analyze/
alors pour commencer avec le HTML, si mon programme lit 2000 caractères, combien cela représente-t-il d'octets ?
Si le texte est au format ISO (récupérer le paramètre charset : http://www.la-grange.net/w3c/html4.0...t.html#h-5.2.1 ), ça fait 2000 octets.
Si le texte est au format UTF-8, là il faut tester la valeur de chaque caractère (les caractères sont des types numériques en Java) : si le caractère est inférieur à 127, il est codé sur un octet, sinon il est codé sur deux octets. Et on fait la somme de tout ça. En fait c'est un peu plus compliqué, mais ce mode de calcul devrait suffire pour toutes les pages écrites en alphabet latin.
Dans un deuxième temps, si tu veux améliorer le support des standards : http://unicode.org
Partager