IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage PHP Discussion :

ressemblance au lieu d'égalité


Sujet :

Langage PHP

  1. #1
    Membre Expert
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 495
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 495
    Billets dans le blog
    1
    Par défaut ressemblance au lieu d'égalité
    Bonsoir,

    je compare 2 listes de données. Au début, chaque élément de la 1e liste avait un correspondant dans la 2e liste et vice-versa. Comme il s'agit de 2 listes de logiciels, voici un exemple : TeamForge_full => teamforge ou bien MathCAD => mathcad. Par contre je voudrais remplacer cette correspondance, informatiquement réalisée par une table de correspondance MySQL :
    Code sql : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    CREATE TABLE `matching_appli_prod` (
      `matching_appli_prod_ident` smallint NOT NULL AUTO_INCREMENT,
      `application_name` varchar(30) CHARACTER SET utf8 COLLATE utf8_bin NOT NULL DEFAULT '',
      `product_name` varchar(30) CHARACTER SET utf8 COLLATE utf8_bin NOT NULL DEFAULT '',
      PRIMARY KEY (`matching_appli_prod_ident`),
      UNIQUE KEY `UK_appli_name` (`application_name`),
      UNIQUE KEY `UK_prod_name` (`product_name`)
    ) ENGINE=InnoDB AUTO_INCREMENT=31 DEFAULT CHARSET=utf8 COLLATE=utf8_bin;
    par une relation du type ce nom ressemble à celui-là ; par exemple, on associerait GitHub Enterprise Cloud à GitHub_Enterprise ou Moldflow Advisor à Moldflow_Adviser_Ultimate (Ces exemples existent). Dans chaque cas, il y a des mots communs ou qui se ressemblent (par exemple Advisor ressemble à Adviser). Avez-vous une idée de conception ?

  2. #2
    Expert confirmé
    Avatar de Séb.
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    5 368
    Détails du profil
    Informations personnelles :
    Âge : 48
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mars 2005
    Messages : 5 368
    Billets dans le blog
    17
    Par défaut
    Avec PHP il existe similar_text() (taux de ressemblance) et levenshtein() (calcul de distance) qui te donnent des indications sur la ressemblance/l'écart entre 2 chaînes

    https://www.php.net/similar-text
    https://www.php.net/levenshtein

    Les 2 fonctions sont plutôt complémentaires, il faudra voir si pour toi elles sont vraiment nécessaires ou si 1 seule suffit

    Avec MySQL dans le même style il n'y a que SOUNDEX(), mais tu peux toujours trouver les algos des fonctions PHP et faire un CREATE FUNCTION ou procéder au calcul PHP régulièrement.

    Dans tous les cas cela reviendrait donc à avoir des tables comme :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    products
    ---------------
    product_id
    product_name
    ...
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    applications
    ---------------
    application_id
    application_name
    ...
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    nearness
    ---------------
    nearness_product [FK products.product_id]
    nearness_application [FK applications.application_id]
    nearness_similarity -- Résultat de similar_text()
    nearness_distance -- Résultat de levenshtein()
    nearness_similarity|distance contenant le résultat du calcul pour chaque combinaison product_name <=> application_name

    Ensuite pour l'exploitation, récupérer les 3 apps dont le nom est le plus proche du produit $product :

    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    SELECT ALL application_id, application_name
    FROM applications
    INNER JOIN nearness ON application_id = nearness_application
    INNER JOIN products ON nearness_product = product_id
    WHERE product_name = '$product'
    ORDER BY -- Tester si tu tries d'abord par similarité ou par distance
        nearness_similarity DESC, -- Taux de similarité le plus élevé en premier
        nearness_distance ASC -- Distance la plus petite en premier
    LIMIT 3

  3. #3
    Expert confirmé
    Avatar de Séb.
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    5 368
    Détails du profil
    Informations personnelles :
    Âge : 48
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mars 2005
    Messages : 5 368
    Billets dans le blog
    17
    Par défaut
    Pendant que j'y pense, sur MySQL il y a aussi l'index FULLTEXT qui permet de faire une recherche et d'avoir un résultat selon un taux de ressemblance.

    Perso, jamais testé sur des données si courtes.

    https://dev.mysql.com/doc/refman/8.0...xt-search.html

  4. #4
    Membre Expert
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 495
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 495
    Billets dans le blog
    1
    Par défaut
    Je suis très bientôt plus dispo jusqu'en milieu d'après-midi. Ensuite, je me pencherai sur tes propositions et reviendrai...

  5. #5
    Membre Expert
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 495
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 495
    Billets dans le blog
    1
    Par défaut
    Hello,
    j'ai enfin pu me repencher sur cette question.

    Pour commencer, j'ai créé comme tu le conseilles, les 3 tables SQL, (applications, products et nearness), les ai un peu alimentées et ai testé la requête :
    Code sql : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    SELECT ALL application_id, application_name
    FROM applications
    INNER JOIN nearness ON application_id = nearness_application
    INNER JOIN products ON nearness_product = product_id
    WHERE product_name = '$product'
    ORDER BY -- Tester si tu tries d'abord par similarité ou par distance
        nearness_similarity DESC, -- Taux de similarité le plus élevé en premier
        nearness_distance ASC -- Distance la plus petite en premier
    LIMIT 3
    Ce que j'ai remarqué, c'est que s'il y a aucune correspondance, le résultat est vide (pour faire le test, j'ai utilisé les noms appli1 et prd1).

    Sinon, cette correspondance me sert uniquement quand je teste une application ou un produit que je viens de lire, pour vérifier si un correspondant existe (avec la méthode getCorrespondantPrdName( $name, $appli_or_prd)). Ce que j'imagine (merci de me dire si c'est la bonne chose), c'est de créer uniquement les 2 premières tables (applications et products), puis dans ma méthode getCorrespondantPrdName( $name, $appli_or_prd) utiliser la fonction PHP similar_text(string $string1, string $string2, float &$percent = null) et décréter que la correspondance existe si le $percent retourné est supérieur à 50. Qu'en penses-tu ?

  6. #6
    Expert confirmé
    Avatar de Séb.
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    5 368
    Détails du profil
    Informations personnelles :
    Âge : 48
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mars 2005
    Messages : 5 368
    Billets dans le blog
    17
    Par défaut
    Ce que j'ai remarqué, c'est que s'il y a aucune correspondance, le résultat est vide
    Dans l'exemple donné il y aura forcément un résultat si la table nearness est correctement renseignée avec les résultats de similar_text() et levenshtein() sur toutes les combinaisons.

    Qu'en penses-tu ?
    Dur de donner un avis, je n'ai pas tous les tenants et tous les aboutissants
    A priori pas besoin de créer de tables products et applications, tu devrais déjà avoir les noms en base
    La table nearest n'est pas forcément utile s'il n'y a pas beaucoup de lignes d'apps/produits (le recalcul serait alors acceptable) ou si c'est uniquement un check suite à une nouvelle entrée.

  7. #7
    Membre Expert
    Avatar de laurentSc
    Homme Profil pro
    Webmaster débutant perpétuel !
    Inscrit en
    Octobre 2006
    Messages
    10 495
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 61
    Localisation : France, Isère (Rhône Alpes)

    Informations professionnelles :
    Activité : Webmaster débutant perpétuel !
    Secteur : Industrie

    Informations forums :
    Inscription : Octobre 2006
    Messages : 10 495
    Billets dans le blog
    1
    Par défaut
    Citation Envoyé par Séb. Voir le message
    Dans l'exemple donné il y aura forcément un résultat si la table nearness est correctement renseignée avec les résultats de similar_text() et levenshtein() sur toutes les combinaisons.
    C'est exact ; j'avais oublié de renseigner un enregistrement pour ces données. Maintenant, c'est bon.

    Citation Envoyé par Séb. Voir le message
    Dur de donner un avis, je n'ai pas tous les tenants et tous les aboutissants
    OK, comme je pense que c'est la bonne direction, je vais la prendre...
    Citation Envoyé par Séb. Voir le message
    A priori pas besoin de créer de tables products et applications, tu devrais déjà avoir les noms en base
    Malheureusement, non, vu que à chaque nouvel essai, je commence par vider la bdd, car sinon, mon appli râle (already exists...)

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 4
    Dernier message: 01/10/2019, 18h29
  2. Pourquoi me conseille t'on le C au lieu de VB ?
    Par hicham000 dans le forum Langages de programmation
    Réponses: 16
    Dernier message: 11/06/2004, 20h38
  3. [BDD] renvoyer une chaine vide au lieu de null
    Par cmoulin dans le forum JDBC
    Réponses: 6
    Dernier message: 06/05/2004, 12h38
  4. Equivalent IN ms avec un ET au lieu du OU ds la lste
    Par Pompil dans le forum Requêtes
    Réponses: 4
    Dernier message: 04/03/2004, 22h20
  5. [TOMCAT] affichage arborescence au lieu d'éxécuter la servle
    Par lombra dans le forum Tomcat et TomEE
    Réponses: 4
    Dernier message: 13/08/2003, 14h30

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo