Bonjour,
Dans un programme Java, je dois lire un fichier dont je ne connais pas l'encodage. Je le lis comme étant de l'unicode (UTF-8), mais à l'intérieur il y a des caractères "inconnus" (un losange noir avec un point d’interrogation).
À défaut de savoir lire ces caractères correctement, j'ai éssayé de lire le fichier dans tous les Charset de la JVM, j'aimerais au moins pouvoir supprimé ces caractères.
Est il possible de faire ça, sans le faire caractère par caractère, avec une regexp par ex.
Merci d'avance,
Partager