IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

Proximité entre deux phrases


Sujet :

Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre éclairé
    Profil pro
    Inscrit en
    Juillet 2006
    Messages
    676
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Juillet 2006
    Messages : 676
    Par défaut Proximité entre deux phrases
    Bonjour,

    Je pars un peu à la pêche j'en suis conscient. Je recherche un algorithme qui me donne la proximité entre deux phrases.
    Par exemple j'ai d'un côté "Tarte aux fraises de bois", "soupe de légumes", "Tourte au poulet"
    Et de l'autre "Gâteau aux fraises", "Tourte de poulet", "soupe"

    Je recherche simplement l’occurrence la plus proche. L'idéal serais que l'algorithme fasse un mix entre comparaisons de caractères et utilisation des synonymes.
    Je me dis qu'il y a des gens qui ont déjà dû réfléchir sur le problème.

  2. #2
    Modérateur
    Avatar de joel.drigo
    Homme Profil pro
    Ingénieur R&D - Développeur Java
    Inscrit en
    Septembre 2009
    Messages
    12 430
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 55
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Ingénieur R&D - Développeur Java
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2009
    Messages : 12 430
    Billets dans le blog
    2
    Par défaut
    Salut,

    Je te confirme que des gens ont réfléchi à ce problème : il y a même des applications qui existent qui permettent de résoudre ce genre de problème. Il peut être résolu de manière plus ou moins complexe d'ailleurs, tout dépend ce qu'on cherche vraiment à faire. J'utilise personnellement dans le cadre professionnel un moteur de recherche sémantique (que je ne citerai pas pour ne pas en faire de publicité), qui est beaucoup plus complexe qu'une comparaison de caractères et de synonyme. Parce que dans le cas général, il n'y a pas que des problèmes aussi basiques (il y'a des notions de pluriel, d'expression équivalente, de conjugaison, de notions sémantiques (si tu cherches dans ce moteur "soupe de légumes", il te trouvera les textes qui contiennent "soupe de tomate, soupes aux légumes, soupe chaude aux poireaux, gaspacho, mais églement "la recette fétiche du chef Untel" (en utilisant une base de connaisances qui permet de savoir que le chef Untel a publié une recette de velouté au potiron, dont il a précisé qu'elle était sa recette préférée dans un autre texte, par exemple); etc...).

    Le faire par comparaison et synonyme est plus simple à implémenter, mais limite énormément les résultats qu'on peut obtenir : en gros, il s'agit juste de faire un dictionnaire d'expressions à considérer comme égales, et d'inventorier tous les cas qu'on veut traiter, mais on aura un résultat très limité, ou un dictionnaire avec un nombre considérable d'expressions.

    Apache Lucene est un moteur de recherche, Open Source, non sémantique à la base, qui utilise différente méthode pour traiter des cas plus génériques que de le faire par comparaison et synonyme (utilises des règles, élimine des comparaisons certains mots considérés comme sans importances (comme les articles), des radicaux (des préfixes communs à plusieurs mots à considerer comme équivalent, etc...).
    L'expression "ça marche pas" ne veut rien dire. Indiquez l'erreur, et/ou les comportements attendus et obtenus, et donnez un Exemple Complet Minimal qui permet de reproduire le problème.
    La plupart des réponses à vos questions sont déjà dans les FAQs ou les Tutoriels, ou peut-être dans une autre discussion : utilisez la recherche interne.
    Des questions sur Java : consultez le Forum Java. Des questions sur l'EDI Eclipse ou la plateforme Eclipse RCP : consultez le Forum Eclipse.
    Une question correctement posée et rédigée et vous aurez plus de chances de réponses adaptées et rapides.
    N'oubliez pas de mettre vos extraits de code entre balises CODE (Voir Mode d'emploi de l'éditeur de messages).
    Nouveau sur le forum ? Consultez Les Règles du Club.

Discussions similaires

  1. Proximité entre deux images
    Par Ceubex dans le forum Général Java
    Réponses: 4
    Dernier message: 26/09/2014, 10h28
  2. Réponses: 2
    Dernier message: 13/04/2010, 07h23
  3. distance entre deux phrases
    Par archer dans le forum Général Java
    Réponses: 2
    Dernier message: 12/11/2009, 00h40
  4. Connexion entre deux ordi [Débutant]
    Par Ryadus dans le forum Développement
    Réponses: 2
    Dernier message: 12/06/2003, 21h47
  5. Réponses: 5
    Dernier message: 25/03/2003, 19h43

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo