IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

PostgreSQL Discussion :

Calculer la "différence" entre deux chaînes


Sujet :

PostgreSQL

  1. #1
    Membre expérimenté
    Profil pro
    Inscrit en
    Février 2004
    Messages
    1 824
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2004
    Messages : 1 824
    Points : 1 544
    Points
    1 544
    Par défaut Calculer la "différence" entre deux chaînes
    Bonjour à tous,

    Je possède une table avec des noms de ville et mon application propose la recherche d'une ville par son nom.

    Au lieu de me baser sur une strict égalité, j'aimerais proposer à l'utilisateur un jeu de résultats plus ou moins pertinent.

    Par exemple s'il tape "Touloe", j'aimerais lui renvoyer :
    - Toulon : 92%
    - Toulouse : 76%
    - Toul : 59%
    etc.

    Est-ce possible avec PostgreSQL ?

    Merci à vous,
    A bientôt
    "Heureusement qu'il y avait mon nez, sinon je l'aurais pris en pleine gueule" Walter Spanghero

  2. #2
    Expert éminent Avatar de kain_tn
    Homme Profil pro
    Inscrit en
    Mars 2005
    Messages
    1 564
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 564
    Points : 7 286
    Points
    7 286
    Par défaut
    Bonjour,

    je crois que ce que tu cherches s'appelle du full text search. Tu peux regarder les fonctions de ranking.
    Copier c'est copier; voler c'est vendre un CD une vingtaine d'euros!


    Code C : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    #include <stdio.h>
     
    int main(int argc, char **argv) {
     
        printf("So long, and thanks for the fish, Dennis...\n");
        return 0;
    }

  3. #3
    Membre expérimenté
    Profil pro
    Inscrit en
    Février 2004
    Messages
    1 824
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2004
    Messages : 1 824
    Points : 1 544
    Points
    1 544
    Par défaut
    Merci pour ta réponse.

    J'ai lu attentivement et ça à l'air de matcher les mots exacts, en y ajoutant des fonctionnalités de pondération, prise en compte de la longueur du document ainsi que des dictionnaires pour gérer des synonymes, des mots à ignorer etc.

    Les données adresses que j'aurai en entrée seront saisies par des utilisateurs de sites web où un opérateur au téléphone, par conséquent, je m'intéresse dans un premier temps aux fautes de frappes ou d'orthographe des mots.

    En fait j'aurai besoin de ces fonctionnalités où mon dictionnaire serait les lettres de l'alphabet et qui gérerait le côté consécutif des lettres ainsi que la longueur.

    C'est faisable ça ?

    Sinon je ferai une fonction, mais utiliser un truc intégrer à PostgreSQL me rassurerait sur les performances..

    Merci à toi,
    A bientôt
    "Heureusement qu'il y avait mon nez, sinon je l'aurais pris en pleine gueule" Walter Spanghero

  4. #4
    Membre expérimenté
    Profil pro
    Inscrit en
    Février 2004
    Messages
    1 824
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Février 2004
    Messages : 1 824
    Points : 1 544
    Points
    1 544
    Par défaut
    Je pense que j'ai trouvé mon bonheur avec ceci : http://www.postgresql.org/docs/8.4/s...ystrmatch.html qui implémente la Distance de Levenshtein

    J'ai créé une fonction qui part de 100 et soustrait la distance de Levenshtein multipliée par un coefficient d'importance selon le type de donnée (genre se planter de pays est plus important que se planter de ville qui est plus important que se planter de rue puis de numéro). Et pour chacune de ces données, se planter de 3 caractères est plus grave que de se planter de deux caractères.

    Merci encore
    "Heureusement qu'il y avait mon nez, sinon je l'aurais pris en pleine gueule" Walter Spanghero

  5. #5
    Expert éminent Avatar de kain_tn
    Homme Profil pro
    Inscrit en
    Mars 2005
    Messages
    1 564
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Suisse

    Informations forums :
    Inscription : Mars 2005
    Messages : 1 564
    Points : 7 286
    Points
    7 286
    Par défaut
    La distance de Levenstein est une bonne méthode pour déterminer le nombre de transformations nécessaires pour passer d'une chaîne à l'autre donc si ton but est de détecter les fautes de frappes, c'est une bonne idée
    Copier c'est copier; voler c'est vendre un CD une vingtaine d'euros!


    Code C : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    #include <stdio.h>
     
    int main(int argc, char **argv) {
     
        printf("So long, and thanks for the fish, Dennis...\n");
        return 0;
    }

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 5
    Dernier message: 02/09/2011, 19h19
  2. Différence entre deux chaînes
    Par gadalla dans le forum Pascal
    Réponses: 3
    Dernier message: 25/02/2008, 14h39
  3. Extraîre une chaîne qui est entre deux chaînes.
    Par Horrigan dans le forum Langage
    Réponses: 5
    Dernier message: 01/09/2006, 19h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo