IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

[débutant] pistes pour un filtrage de Strings


Sujet :

Algorithmes et structures de données

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    12
    Détails du profil
    Informations personnelles :
    Localisation : Belgique

    Informations forums :
    Inscription : Mars 2005
    Messages : 12
    Par défaut [débutant] pistes pour un filtrage de Strings
    Bonjour,

    J'aimerais avoir quelques pistes, savoir vers quoi je pourrais me diriger. J'ai effectué une recherche, mais je n'ai pas trouver ce qui pourrait me satisfaire.

    Plantons le décor: j'aimerais pouvoir filtrer des rues. J'ai donc une liste avec des noms de rues (+/- 1.000) et j'aimerais (si je ne retrouve pas l'expression exacte) avoir les résultats les plus approchants (10).
    Avec comme contraintes qu'un des mots qui compose le nom pourrait s'écrire d'une autre façon. Par exemple l' "avenue Jean dupont" pourrait s'écrire "avenue j. dupont".

    Je ne sais pas si je me suis bien fait comprendre. Si oui, quelqu'un aurait une idée de l'algo (ou des algos) que je dois aller potasser?

    Merci d'avance

    update:
    Après une recherche sur wikipedia j'ai vu l'algo de Knuth-Pratt-Morris et celui de Boyer-Moore et j'ai entendu parler de "match - non match" (mais là pas d'infos). Est-ce un bon début?

  2. #2
    Membre éprouvé Avatar de bluemartini
    Profil pro
    Inscrit en
    Avril 2006
    Messages
    154
    Détails du profil
    Informations personnelles :
    Âge : 45
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations forums :
    Inscription : Avril 2006
    Messages : 154
    Par défaut
    J'ai une idée d'algo :
    déjà tu te fais une matrice de couts entre caractère. Je m'explique : si dans une phrase tu vois un t qui est comparé à un d en fin de phrase, la probabilité d'erreur est forte, donc a un côut faible. Par contre un f avec un l, c'est peu probable comme erreur, donc tu lui donnes une coût élevé.

    avec ton adresse de départ, tu la compares avec chaque adresse de la liste. Pour chaque comparaison tu établit le coût (qui vaut 0 pour chaque caractère qui match).
    Biensûrs, si tu compare une adresse avec une autre plus longue, tu peux faire glisser la plus courte le long de la plus longue et étudier le coût pour chaque solution.
    et tu prend l'adresse qui établit le plus faible coût.


Discussions similaires

  1. [débutant] gotoandstop pour revenir ?!?
    Par ajor dans le forum Flash
    Réponses: 13
    Dernier message: 27/09/2007, 16h55
  2. [VB.net] Piste pour Alias Macro (débutant)
    Par Petit padawan dans le forum Windows Forms
    Réponses: 3
    Dernier message: 26/07/2005, 20h17
  3. [Débutant][JSP] Ajout des caractères à une String...
    Par Henkyl dans le forum Servlets/JSP
    Réponses: 5
    Dernier message: 04/03/2004, 16h30
  4. Réponses: 3
    Dernier message: 14/02/2004, 10h10
  5. [Débutant] Triage de données dans un String
    Par Poilou dans le forum C++Builder
    Réponses: 4
    Dernier message: 29/01/2004, 16h21

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo