IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

 Delphi Discussion :

[Bug?] TStringList et caractères spéciaux


Sujet :

Delphi

  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Octobre 2002
    Messages
    707
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2002
    Messages : 707
    Points : 777
    Points
    777
    Par défaut [Bug?] TStringList et caractères spéciaux
    Bonjour,

    J'utilise un TStringList pour trier une liste de noms et éliminer les doublons, grâce à ses propriétés Duplicates et Sorted.
    Mais quand j'ajoute des noms avec le caractère "a en e" (æ) le TStringList ne semble pas faire la distinction avec un simple "ae". Ex:

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    procedure TForm1.Button1Click(Sender: TObject);
    var
      sl: TStringList;
    begin
      sl := TStringList.Create;
      sl.Duplicates := dupIgnore;
      sl.Sorted := TRUE;
     
      sl.Add('Stabæk');
      sl.Add('Stabaek');
     
      Memo1.Lines.AddStrings(sl);	// Contient uniquement "Stabæk" !
     
      sl.Free;
    end;
    Est-ce un bug, est-ce le fonctionnement normal (D2010) ? Et surtout, comment faire pour obtenir le comportement souhaité ?

  2. #2
    Rédacteur/Modérateur
    Avatar de Andnotor
    Inscrit en
    Septembre 2008
    Messages
    5 695
    Détails du profil
    Informations personnelles :
    Localisation : Autre

    Informations forums :
    Inscription : Septembre 2008
    Messages : 5 695
    Points : 13 133
    Points
    13 133
    Par défaut
    Bug non ! En tout cas pas au niveau Delphi.

    Si on regarde d'un peu plus prêt l'implémentation, on constate que le tri se fait à l'aide de l'API CompareString. Mais CompareString n'est pas une comparaison caractère par caractère. Les mots sont "interprétés" en fonction d'une langue définie. Ce qui est assez logique finalement : dans une fonction de tri on aimerait bien que œil se situe près de oeil et non pas après le dernier Z !

    Malheureusement, le problème est lié : Delphi en rajoute une couche en voulant supprimer les doublons. Il se base de plus sur la langue par défaut de l'utilisateur (peut-être la seule erreur Delphi) et puisque pour le français les mots avec ou sans ligature sont considérés comme identiques par la fonction... pas d'ajout.

    Mais tu aurais bien tes deux entrées distincts æ,ae sur un système en Danois

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    //Identique
    CompareString(LANG_SYSTEM_DEFAULT, 0, 'Stabaek', -1, 'Stabæk', -1);
     
    //Différent
    CompareString(MAKELANGID(LANG_DANISH, 0), 0, 'Stabaek', -1, 'Stabæk', -1);
    Bref, à part te faire une fonction de tri/doublon "maison"...

  3. #3
    Membre éclairé
    Profil pro
    Inscrit en
    Octobre 2002
    Messages
    707
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2002
    Messages : 707
    Points : 777
    Points
    777
    Par défaut
    Super, merci. Grâce à ta réponse j'ai trouvé ce lien qui fonctionne très bien pour mon cas.

  4. #4
    Rédacteur/Modérateur
    Avatar de Andnotor
    Inscrit en
    Septembre 2008
    Messages
    5 695
    Détails du profil
    Informations personnelles :
    Localisation : Autre

    Informations forums :
    Inscription : Septembre 2008
    Messages : 5 695
    Points : 13 133
    Points
    13 133
    Par défaut
    Ok ! Mais si la liste est longue, une comparaison atom-ique pourrait se révéler plus performante qu'un CompareStr

    (Non testé)
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    function TStringListEx.Find(const S: string; var Index: Integer): Boolean;
    var
      Atom1, Atom2 :TAtom;
      i :integer;
     
    begin
      Result := FALSE;
     
      Atom1 := AddAtom(PChar(s));
     
      for i := 0 to Count -1 do
      begin
        Atom2  := AddAtom(PChar(Self[i]));
        Result := Atom1 = Atom2;
        DeleteAtom(Atom2);
     
        if Result then
        begin
          Index := i;
          Break;
        end;
      end;
     
      DeleteAtom(Atom1);
    end;

  5. #5
    Membre éclairé
    Profil pro
    Inscrit en
    Octobre 2002
    Messages
    707
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Octobre 2002
    Messages : 707
    Points : 777
    Points
    777
    Par défaut
    Quelques centaines/milliers de chaînes courtes dans mon cas, le temps de traitement est infime, mais... c'est quoi ça TAtom ??? Jamais entendu parler ! Et mes recherches sur Ggle ne renvoient que des pages en cyrillique !!!

  6. #6
    Rédacteur/Modérateur
    Avatar de Andnotor
    Inscrit en
    Septembre 2008
    Messages
    5 695
    Détails du profil
    Informations personnelles :
    Localisation : Autre

    Informations forums :
    Inscription : Septembre 2008
    Messages : 5 695
    Points : 13 133
    Points
    13 133
    Par défaut
    Un atom est un identificateur de chaîne dans une table (Atom Table) qui peut être propre au processus ou globale au système. Elle n'a pas besoin d'être créée manuellement, le système s'en charge.
    L'ajout à cette table de deux chaînes identiques (indépendamment de la case) renvoi le même identificateur, le même atom.

    Même sans le savoir, on l'utilise régulièrement. Quelques exemples : les formats du presse-papier, la communication DDE, RegisterWindowMessage, etc.

    C'est aussi une façon simple d'envoyer des chaînes courtes (max. 255 bytes) à une autre application en asynchrone (PostMessage)

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [Sybase] filtre sur caractères spéciaux
    Par montelieri dans le forum Sybase
    Réponses: 4
    Dernier message: 07/04/2003, 16h49
  2. Traiter les caractères spéciaux
    Par ricola dans le forum Langage
    Réponses: 2
    Dernier message: 20/02/2003, 09h23

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo