bonjours,
voila, j'ai un fichier html qui contient dans son code source des caractère unicode sous forme " ’ ; " dans ce cas c'est l'apostrophe.
lorsque je parse mon fichier html avec :

open($fh, "<:utf8",$html_file) || die "...: $!";
$te->parse_file($fh);

il me renvoie des carre.....