Problème de Charset variable !
Bonjour,
Je tâche de mettre l'export HTML de ma bibliothèque iTunes en BD UTF-8. Cette bibliothèque est originaire d'un PC sous W7.
C'est essentiellement le chemin des morceaux qui me pose problème :
- '&' est remplacé par '&' ce qui est trivial à pallier ;
- des caractères (souvent accentués) sont remplacés par un code hexa style '%C5%A1', plus complexe à gérer pour les raisons exposées ci-après.
Par exemple, je dois traduire :
Citation:
file://localhost/C:/Users/R%C3%A9gine/Music/iTunes/iTunes%20Media/Music/Delphine%20Volange/_..Et%20de%20Delphine%20Volange%20le%20ciel%20%C3%A9tait/05%20H%C3%B4tel%20Chopin.mp3
en
Citation:
file://localhost/C:/Users/Régine/Music/iTunes/iTunes Media/Music/Delphine Volange/_..Et de Delphine Volange le ciel était/05 Hôtel Chopin.mp3
Ce qui se complique pour d'autres chemins, dont les codes ne sont pas évidents... Selon les morceaux, 'À' (A majuscule avec accent grave) est codé par '%C2%A7' ou '%C3%80', par exemple, alors que sous Word il est donné pour 00C0 ! Et que Char($C2A7) me donne autre chose...
Ceci m'oblige à tâtonner, faute que fonctionne par exemple S := TIdURI.URLDecode(KeyValue);.
Je manque d'une solution globale, univoque, efficace.
Merci pour vos pistes !
[EDIT] Les exemples que je donne ne sont pas forcément justes, mais issus d'un mix qualitatif de mes nombreux errements...
1 pièce(s) jointe(s)
Vous avez dit "UTF-8", mais c'est très simple !
Si ça peut aider, en PJ un document de ma conception sur le codage UTF-8 qui évite les fastidieux discours (et en anglais de surcroit) des spécifications Unicode ou ISO 10648.