Bonsoir,

Je dispose de fichiers texte assez lourds résultat d'OCR sur des textes multilingue. Russe-Allemand-Français-Suédois- etc....
Ces fichiers sont codés UTF8 Unicode dans un environnement Windows.
Certains mots utilisent par erreur des caractères latins (A, C, K, M, T) dans les mots russes et réciproquement.
Je cherche la meilleure solution pour corriger chaque mot en remplaçant les caractères latins dans les mots russes et réciproquement.
Les pages Unicode sont bien différenciées 0100 ou 0200 pour le latin et 0400 pour le cyrillique.
Une idée ?