Précédent   Forum du club des développeurs et IT Pro > Autres langages > Pascal > Lazarus
Lazarus Forum d'entraide sur Lazarus, l'EDI RAD multiplateforme basé sur Free Pascal
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse
 
Outils de la discussion
Publicité
'
Vieux 09/01/2013, 14h00   #1
chris78320
Membre à l'essai
 
Homme
Inscription : octobre 2012
Messages : 22
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Yvelines (Île de France)

Informations forums :
Inscription : octobre 2012
Messages : 22
Points : 21
Points : 21
Par défaut [1.0.4/Win XP] Caractères spéciaux dans base de données

Bonjour,

je dispose d'une table dbf issue d'un vieux programme développé avec Delphi. Quand je cherche à y accéder par un programme fait avec Lazarus, les carctères spéciaux (accents, ° par exemple) ne sont pas reconnus.

Y a-t-il un moyen simple de transformer le codage de l'ensemble de la base pour l'utiliser sous Lazarus ?

Ma seule idée (me semblant un peu lourde) : créer une autre table de structure identique, lire la base initiale enregistrement par enregistrement, transcoder UTF/Ansi (voir mon post précédent sur les problèmes d'accents dans les noms de fichier) tous les champs pouvant poser problème, puis insérer l'enregistrement dans la nouvelle table ...

(avec cette méthode impossible de partager les données avec une autre appli codée en delphi par exemple).

Cordialement.
chris78320 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/01/2013, 09h13   #2
tintinux
Membre éclairé
 
Développeur informatique
Inscription : janvier 2010
Messages : 234
Détails du profil
Informations personnelles :
Âge : 55

Informations professionnelles :
Activité : Développeur informatique

Informations forums :
Inscription : janvier 2010
Messages : 234
Points : 334
Points : 334
Bonjour

Si je me rappelle bien, dans un fichier DBF les chaînes sont en ANSI, mais il y a aussi des données binaires pour stocker les nombres notamment. Il est donc exclu d'encoder le fichier globalement, car l'encodage ne concerne que les chaînes.

Il suffit pour chaque enregistrement, d'encoder avec ANSItoUTF8 chaque champ chaîne lu avant de l'afficher sous Lazarus (et éventuellement l'inverse avec UTF8ToANSI pour l'enregistrer dans le fichier DBF).

Cela peut parfaitement être fait "à la volée", si tu veux partager les données avec une vieille application et c'est très peu consommateur.

Je te conseillerais quand même de passer à autre chose, car les fichiers DBF, qui ont quand même plus de 30 ans, vont être de moins en moins supportés. Tu peux exporter ton fichier DBF en délimité et le relire dans un fichier SqlLite, ou dans une table MySql ou autre.
__________________
Cordialement,
Tintinux

Initiateur de Gestinux, une comptabilité gestion open-source, pour Linux, Windows et Mac OS.
Elle est en cours de développement, avec Lazarus. Vous pouvez peut-être aider à la tester, la traduire et à la développer.
tintinux est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/01/2013, 17h04   #3
chris78320
Membre à l'essai
 
Homme
Inscription : octobre 2012
Messages : 22
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Yvelines (Île de France)

Informations forums :
Inscription : octobre 2012
Messages : 22
Points : 21
Points : 21
Bonjour,

je dois avouer que je ne sais pas trop comment faire pour encoder "à la volée" un champ avant de l'afficher. J'ai fait différents essais notamment dans l'événement OnDataChange d'un Datasource mais rien de concluant ...

Passer à autre chose ... c'est effectivement également une de mes pistes de réflexion. Je teste en ce moment Sqlite mais je rame pas mal pour l'instant !

PS : j'ai constaté un truc bizarre, j'ai le signe ° dans ma base qui n'est pas reconnu mais après encodage, je ne le retrouve pas, il est remplacé par un petit rond barré en position basse !
chris78320 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/01/2013, 17h21   #4
tintinux
Membre éclairé
 
Développeur informatique
Inscription : janvier 2010
Messages : 234
Détails du profil
Informations personnelles :
Âge : 55

Informations professionnelles :
Activité : Développeur informatique

Informations forums :
Inscription : janvier 2010
Messages : 234
Points : 334
Points : 334
Si tu utilises une table ou une query liée à une datasource, c'est l'événement OnGetText qui permet de modifier ce que tu lis.

Code :
1
2
3
4
5
6
procedure TFormImport.StringOnGetText(Sender: TField; var aText: string;
  DisplayText: boolean);
 
begin
   aText := ANSIToUTF8(Sender.AsString);
end;
__________________
Cordialement,
Tintinux

Initiateur de Gestinux, une comptabilité gestion open-source, pour Linux, Windows et Mac OS.
Elle est en cours de développement, avec Lazarus. Vous pouvez peut-être aider à la tester, la traduire et à la développer.
tintinux est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 10/01/2013, 17h57   #5
chris78320
Membre à l'essai
 
Homme
Inscription : octobre 2012
Messages : 22
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Yvelines (Île de France)

Informations forums :
Inscription : octobre 2012
Messages : 22
Points : 21
Points : 21
Merci, j'ai compris, le OnGetText du champ concerné ...

En revanche, l'encodage ne fonctionne pas. Je n'ai plus les ? à la place des caractères posant problème mais :

ø au lieu de °
, au lieu de é
... au lieu de à

Cordialement.
chris78320 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/01/2013, 09h21   #6
tintinux
Membre éclairé
 
Développeur informatique
Inscription : janvier 2010
Messages : 234
Détails du profil
Informations personnelles :
Âge : 55

Informations professionnelles :
Activité : Développeur informatique

Informations forums :
Inscription : janvier 2010
Messages : 234
Points : 334
Points : 334
Bon, alors c'est sans doute que les chaînes que tu soumets à AnsiToUtf8 ne sont pas encodées en ANSI.

Il peut y avoir plusieurs raisons, il va falloir chercher...

DBase emploie peut être un autre jeu de caractères, j'avoue que j'ai totalement oublié ce produit.

Ou alors, l'interface que tu utilises pour lire le fichier DBF (laquelle est-ce ?) effectue déjà un encodage. Pour certaines bases de données et certains pilotes, on peut spécifier un encodage "automatique", mais je ne sais pas si cela te concerne.

Ou alors enfin il y a, dans l'un des deux cas ci-dessus, un encodage qui n'est pas conforme à la norme, ça s'est déjà vu.

Tu pourrais essayer d'exporter ton fichier en délimité en utilisant dBase si tu l'as, ou avec Delphi, ou avec Lazarus sans encoder. Ensuite ouvrir ce fichier "plat" avec Lazarus, et regarder avec clic-droit, paramètres fichier, encodage quel est l'encodage deviné. Eventuellement faire la même chose avec PsPad pour confirmer.

Courage, il n'y a pas que toi qui as des soucis avec ce sujet !
__________________
Cordialement,
Tintinux

Initiateur de Gestinux, une comptabilité gestion open-source, pour Linux, Windows et Mac OS.
Elle est en cours de développement, avec Lazarus. Vous pouvez peut-être aider à la tester, la traduire et à la développer.
tintinux est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 11/01/2013, 16h18   #7
acaumes
Membre habitué
 
Homme Alain Caumes
Chef de projet MOA
Inscription : juillet 2011
Messages : 49
Détails du profil
Informations personnelles :
Nom : Homme Alain Caumes
Localisation : France, Seine et Marne (Île de France)

Informations professionnelles :
Activité : Chef de projet MOA
Secteur : Transports

Informations forums :
Inscription : juillet 2011
Messages : 49
Points : 120
Points : 120
Bonjour,

A voir les caractères, je pense qu'il s'agit d'un codage OEM (c'est à dire codage utilisé avec DOS (et que l'on retrouve encore dans les boites de commandes DOS)

Cordialement
acaumes est déconnecté   Envoyer un message privé Réponse avec citation 10
Vieux 11/01/2013, 16h24   #8
Jon Shannow
Membre Expert
 
Avatar de Jon Shannow
 
Homme
Responsable de service informatique
Inscription : avril 2011
Messages : 1 158
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Ille et Vilaine (Bretagne)

Informations professionnelles :
Activité : Responsable de service informatique
Secteur : High Tech - Électronique et micro-électronique

Informations forums :
Inscription : avril 2011
Messages : 1 158
Points : 1 720
Points : 1 720
Je pense que c'est cela, en effet. Les fichiers dBase datent des années 80 alors ANSI/UTF8... C'est du codage DOS.
__________________
Citations :
Le scientifique lira des centaines de livres au cours de sa vie et restera persuadé qu'il lui reste beaucoup à apprendre.
Un religieux n'en lira qu'un et sera persuadé d'avoir tout compris.

Il n'est pas de vent favorable pour celui qui ne sait pas où il va. (Sénèque)
Jon Shannow est actuellement connecté   Envoyer un message privé Réponse avec citation 10
Vieux 11/01/2013, 18h52   #9
chris78320
Membre à l'essai
 
Homme
Inscription : octobre 2012
Messages : 22
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Yvelines (Île de France)

Informations forums :
Inscription : octobre 2012
Messages : 22
Points : 21
Points : 21
Pour préciser : j'en suis resté à delphi 2 (Version Développeur pour avoir l'accès aux BD) et j'ai des tables Paradox (crées avec l'outil fourni avec delphi).

Comme je souhaite passer à Lazarus (2 motivations principales : outil plus récent et possibilité de porter sous Linux), j'ai, pour pouvoir faire des tests, transféré une de mes tables (celle avec laquelle je découvre ce problème de jeux de caractères !) en table DB grâce au composant TBatchMove. Ceci afin de pouvoir accéder à cette table sous Lazarus avec le composant TDbf ...

Si cela aide à comprendre comment elles sont codées ... je croyais que OEM et ANSI, c'était la même chose !

Merci à tous pour vote aide.
chris78320 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/01/2013, 21h03   #10
acaumes
Membre habitué
 
Homme Alain Caumes
Chef de projet MOA
Inscription : juillet 2011
Messages : 49
Détails du profil
Informations personnelles :
Nom : Homme Alain Caumes
Localisation : France, Seine et Marne (Île de France)

Informations professionnelles :
Activité : Chef de projet MOA
Secteur : Transports

Informations forums :
Inscription : juillet 2011
Messages : 49
Points : 120
Points : 120
Bonjour,

Pas tout à fait.

Le codage OEM a été mis en œuvre avec DOS (à partir de la version 2 je crois)

Le codage ANSI lui est arrivé avec Windows.

Vois cette discussion ... http://www.developpez.net/forums/d10...ansi-vers-oem/

LA table de trans-codification complète : http://profgeii.free.fr/explorer/ii1/ASCII.pdf

Windows fournit des routines pour convertir OEM vers Ansi (OemToAnsi) qui sont reprises dans l'unité Windows

Cordialement
acaumes est déconnecté   Envoyer un message privé Réponse avec citation 30
Vieux 12/01/2013, 09h13   #11
tintinux
Membre éclairé
 
Développeur informatique
Inscription : janvier 2010
Messages : 234
Détails du profil
Informations personnelles :
Âge : 55

Informations professionnelles :
Activité : Développeur informatique

Informations forums :
Inscription : janvier 2010
Messages : 234
Points : 334
Points : 334
Citation:
Envoyé par acaumes Voir le message
Windows fournit des routines pour convertir OEM vers Ansi (OemToAnsi) qui sont reprises dans l'unité Windows
Dans l'unité Windows de Delphi ? Il n'y pas de telle unité dans Lazarus.

En fait le terme OEM est assez générique, mais si je ne me trompe l'OEM français s'appelle CP 850. Donc la fonction CP850ToUTF8 de Lazarus (unité LConvEncoding) devrait faire l'affaire.
__________________
Cordialement,
Tintinux

Initiateur de Gestinux, une comptabilité gestion open-source, pour Linux, Windows et Mac OS.
Elle est en cours de développement, avec Lazarus. Vous pouvez peut-être aider à la tester, la traduire et à la développer.
tintinux est déconnecté   Envoyer un message privé Réponse avec citation 30
Vieux 12/01/2013, 14h53   #12
chris78320
Membre à l'essai
 
Homme
Inscription : octobre 2012
Messages : 22
Détails du profil
Informations personnelles :
Sexe : Homme
Localisation : France, Yvelines (Île de France)

Informations forums :
Inscription : octobre 2012
Messages : 22
Points : 21
Points : 21
Cela doit bien être du CP850 car avec CP850ToUTF8, cela marche, enfin presque !!!

Avec : aText := CP850ToUTF8(Sender.AsString);
dans l'événement OnGetText d'un champ de type texte (TstringField), j'arrive à retrouver la bonne écriture.

En revanche, j'obtiens un résultat insatisfaisant pour les champs TMemoField : dans une grille, au lieu d'avoir "(MEMO)", j'ai le texte corrigé avec 2 petits carrés pour chaque retour à la ligne. Mais aucun changement pour l’affichage du champ dans un TDBMemo.
chris78320 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 12/01/2013, 14h57   #13
acaumes
Membre habitué
 
Homme Alain Caumes
Chef de projet MOA
Inscription : juillet 2011
Messages : 49
Détails du profil
Informations personnelles :
Nom : Homme Alain Caumes
Localisation : France, Seine et Marne (Île de France)

Informations professionnelles :
Activité : Chef de projet MOA
Secteur : Transports

Informations forums :
Inscription : juillet 2011
Messages : 49
Points : 120
Points : 120
Bonjour,

L'unité Windows est dans la rtl de fpc, pas dans Lazarus mais c'est presque la même chose

Citation:
This file is part of the Free Pascal run time library.
This unit contains the record definition for the Win32 API
Copyright (c) 1999-2000 by Florian KLaempfl,
member of the Free Pascal development team.

Par contre je ne connaissais pas les routines que tu cites. je vais regarder.

Cordialement
acaumes est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Cette discussion est résolue.
Outils de la discussion

Navigation rapide


Fuseau horaire GMT +2. Il est actuellement 09h29.


 
 
 
 
Partenaires

Hébergement Web