IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

Comparaison de chaines de caractères


Sujet :

Langage PHP

  1. #1
    Futur Membre du Club
    Homme Profil pro
    Comptable
    Inscrit en
    Mars 2014
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Comptable

    Informations forums :
    Inscription : Mars 2014
    Messages : 10
    Points : 5
    Points
    5
    Par défaut Comparaison de chaines de caractères
    Bonjour,

    Pour éviter de polluer les discussions des autres je vais en créer une.

    Je voulais juste un peu d'aide pour savoir quelle est la fonction la plus adaptée entre levenshtein() et similar_text() pour vérifier si le "Nom, Prenom" d'une personne se trouve dans une base de données.

    Merci d'avance

  2. #2
    Expert éminent Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 858
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 858
    Points : 6 556
    Points
    6 556
    Par défaut
    Je dirai aucune des deux. Pourquoi penses-tu devoir faire une recherche sur des nom/prénoms avec une orthographe approximative? Moi, je me contenterai de formater la chasse des caractères, mais c'est tout. À noter aussi que deux personnes (ou plus) peuvent avoir le même nom/prénom.
    Brachygobius xanthozonus
    Ctenobrycon Gymnocorymbus

  3. #3
    Futur Membre du Club
    Homme Profil pro
    Comptable
    Inscrit en
    Mars 2014
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Comptable

    Informations forums :
    Inscription : Mars 2014
    Messages : 10
    Points : 5
    Points
    5
    Par défaut
    Bonjour CosmoKnacki,

    Merci pour votre réponse.

    Il s'agit en fait de trouver juste une correspondance. Nous avons une liste de personnes avec qui il est interdit de faire affaire et l'obligation de vérifier périodiquement que ces personnes ne figurent pas parmi les gens avec qui nous traitons.

    Je pensai donc comparer (à l'aide de ces fonctions) chaque individu de notre base de données à tous les individus de la base de données des personnes à exclure.

    Le but étant d'identifier les individus qui figurent dans les deux base de données.

    Est-ce que vous savez s'il existe une méthode applicable à ce problème ?

  4. #4
    Modérateur
    Avatar de sabotage
    Homme Profil pro
    Inscrit en
    Juillet 2005
    Messages
    29 208
    Détails du profil
    Informations personnelles :
    Sexe : Homme

    Informations forums :
    Inscription : Juillet 2005
    Messages : 29 208
    Points : 44 155
    Points
    44 155
    Par défaut
    La question c'est pourquoi faire une comparaison approximative et pas une comparaison ferme ?
    N'oubliez pas de consulter les FAQ PHP et les cours et tutoriels PHP

  5. #5
    Futur Membre du Club
    Homme Profil pro
    Comptable
    Inscrit en
    Mars 2014
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Comptable

    Informations forums :
    Inscription : Mars 2014
    Messages : 10
    Points : 5
    Points
    5
    Par défaut
    Citation Envoyé par sabotage Voir le message
    La question c'est pourquoi faire une comparaison approximative et pas une comparaison ferme ?
    Désolé. Je n'avais pas bien compris.

    Il peut y avoir de légères variations dans l'orthographe.

    Je pensai donc identifier les données qui correspondent à 90% ou plus et les lister pour aller les vérifier.

    Si vous avez une autre option à me proposer je suis preneur.

    Bien cordialement

  6. #6
    Expert éminent Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 858
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 858
    Points : 6 556
    Points
    6 556
    Par défaut
    Je ne pense pas que tu pourras tirer grand chose de similar_text() car elle renvoie des résultats différents quand l'ordre des paramètres est inversé (difficile de fixer un seuil de tolérance dans ces conditions).
    Pour ce qui est de levenshtein() pourquoi pas mais en gardant à l'esprit que cette fonction devient très lente dés que la taille des chaînes en question est grande. Si c'est pour comparer plusieurs petites chaîne, ça peut faire l'affaire. C'est une fonction bien adaptée pour les erreurs de frappe mais un peu moins pour l'orthographe.

    Si tu travailles à partir d'une base de données, ce que tu peux faire c'est créer deux colonnes supplémentaires dans ta table contenant les clefs soundex pour chaque nom et prénom. Comme ça tu peux faire un premier filtrage rapide, puis ensuite tu utilises levenshtein() pour affiner.

    À tester.
    Brachygobius xanthozonus
    Ctenobrycon Gymnocorymbus

  7. #7
    Futur Membre du Club
    Homme Profil pro
    Comptable
    Inscrit en
    Mars 2014
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Comptable

    Informations forums :
    Inscription : Mars 2014
    Messages : 10
    Points : 5
    Points
    5
    Par défaut
    Citation Envoyé par CosmoKnacki Voir le message
    Je ne pense pas que tu pourras tirer grand chose de similar_text() car elle renvoie des résultats différents quand l'ordre des paramètres est inversé (difficile de fixer un seuil de tolérance dans ces conditions).
    Pour ce qui est de levenshtein() pourquoi pas mais en gardant à l'esprit que cette fonction devient très lente dés que la taille des chaînes en question est grande. Si c'est pour comparer plusieurs petites chaîne, ça peut faire l'affaire. C'est une fonction bien adaptée pour les erreurs de frappe mais un peu moins pour l'orthographe.

    Si tu travailles à partir d'une base de données, ce que tu peux faire c'est créer deux colonnes supplémentaires dans ta table contenant les clefs soundex pour chaque nom et prénom. Comme ça tu peux faire un premier filtrage rapide, puis ensuite tu utilises levenshtein() pour affiner.

    À tester.
    Merci pour cette piste.

    Je suppose que si je passe par le code pour appliquer soundex() et de faire passer le résultat dans levenshtein() ce sera plus lent. Passer par votre solution de rajouter des colonnes dans le base de données me semble plus adapté.

    Un grand merci pour votre aide CosmoKnacki

  8. #8
    Expert éminent Avatar de CosmoKnacki
    Homme Profil pro
    Justicier interdimensionnel
    Inscrit en
    Mars 2009
    Messages
    2 858
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Charente Maritime (Poitou Charente)

    Informations professionnelles :
    Activité : Justicier interdimensionnel

    Informations forums :
    Inscription : Mars 2009
    Messages : 2 858
    Points : 6 556
    Points
    6 556
    Par défaut
    Oui c'est l'idée, sachant que la fonction soundex pourrait aussi être remplacée par une fonction "maison" qui tiendrait le même rôle et qui collerait au plus prés des critères que tu juges importants.
    Brachygobius xanthozonus
    Ctenobrycon Gymnocorymbus

  9. #9
    Futur Membre du Club
    Homme Profil pro
    Comptable
    Inscrit en
    Mars 2014
    Messages
    10
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Canada

    Informations professionnelles :
    Activité : Comptable

    Informations forums :
    Inscription : Mars 2014
    Messages : 10
    Points : 5
    Points
    5
    Par défaut
    Citation Envoyé par CosmoKnacki Voir le message
    Oui c'est l'idée, sachant que la fonction soundex pourrait aussi être remplacée par une fonction "maison" qui tiendrait le même rôle et qui collerait au plus prés des critères que tu juges importants.
    Bonjour CosmoKnacki,

    Merci beaucoup pour votre aide. J'ai déjà un résultat avec l'usage de la fonction soundex().

    Je suis désolé de la réponse tardive, j'ai été un peu pris ces derniers jours.

    Bien cordialement

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. [débutant] Comparaison début chaines de caractères
    Par Anthony17 dans le forum Delphi
    Réponses: 2
    Dernier message: 01/06/2006, 16h44
  2. Réponses: 2
    Dernier message: 10/05/2006, 15h23
  3. comparaison de chaine de caractères
    Par lecyberax dans le forum C
    Réponses: 10
    Dernier message: 24/03/2006, 19h30
  4. Réponses: 2
    Dernier message: 23/03/2006, 12h39
  5. Réponses: 11
    Dernier message: 22/03/2006, 21h57

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo