IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Java Discussion :

Moteur de recherche, filtrage


Sujet :

Java

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Profil pro
    Inscrit en
    Décembre 2004
    Messages
    35
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2004
    Messages : 35
    Par défaut Moteur de recherche, filtrage
    Bonjour,

    Je poste un sujet pour avoir un conseil technique.
    Dans le cadre du développement d'une appli, je suis amené à développer un moteur de recherche en Java.
    A part avoir soulevé les cas triviaux (empêcher le moteur de tourner à vider ou limiter le nombre de mots dans l'input), j'ai évoqué aussi le cas du filtrage de certains mots.
    En effet, il parait pas opportun de faire tourner le moteur si une personne entre des mots non significatifs.
    Par mots non significatifs, j'entends les petits mots en français comme : un, le, la, du, au, aux, une, alors, mais, où, donc, or, ni, etc...
    Impossible de travailler sur la longueur de ces mots...
    Une idée a été de filtrer au niveau de la base de données, mais à part les mettre dans une liste "hard-codée", je ne vois pas trop.
    En Java, même topo, j'ai l'impression... créer une liste ou un enum dans lequel on les met les uns après les autres...
    Si quelqu'un a une idée "optimisée", je suis preneur.

    Merci.

  2. #2
    Membre confirmé
    Profil pro
    Inscrit en
    Décembre 2009
    Messages
    174
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2009
    Messages : 174
    Par défaut
    Effectivement sans stocker la liste de mots à ne pas considérer lors de la recherche ce n'est pas possible à mon avis car ton pogramme ne peut pas les "deviner" (à moins de mettre des règles du genre ne pas considérer les mots de x caractères mais au risque d'en ignorer que tu ne voulais pas ignorer)... . Après rien ne t'empache de charger ta liste de mots à ne pas considérer à partir d'un simple fichier texte ou csv par exemple si tu ne veux pas t'embêter avec une base de données (nécessite les "compétences" comme par exemple la connaissance du SQL pour celui qui devra mettre à jour la liste) ou bien pour ne pas mettre la liste en dûr dans le code ce qui obligerait à modifier le code si on veut ajouter un jour un nouveau mot à exclure . Le parsing d'un fichier texte par exemple est simple et rapide pour le cas d'une simple liste de mot séparé par un séparateur particulier.

  3. #3
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Avril 2012
    Messages
    51
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Avril 2012
    Messages : 51
    Par défaut
    Salut,
    Comme la dis philou44300 à moins d'utilise une taille de mot ils faut les avoir en brute.
    Sache quand même que dans la langue francaise les mot de moins de 4 caractere sont rarement porteur de sens a eux seule.
    Donc soit tu fais un anti-dico dans un fichier text soit tu trouve une autre solution.
    Tu peut aussi faire en sorte de donnée des valeur au mot.
    La valeur et donne en fonction par exemple de la taille ou du nombre de fois ou elle apparais dans la requete.
    Enssuite les documents auront une valeur en fonction du nombre de mots trouve.
    Valeur du document = nombre de fois chaque mot trouve * valeur moyenne des mots / % du mot inutile.
    Il te reste plus qu'a les affiche par ordre de grandeur.
    L'autre truc interessant et de faire en sorte que deux verbe conjuger differament soit considere comme identique.

Discussions similaires

  1. [Info]moteur de recherche full text en environnement j2ee
    Par ddams dans le forum API standards et tierces
    Réponses: 4
    Dernier message: 03/11/2004, 19h39
  2. comment faire ma base de donnée pour un moteur de recherche
    Par HoB dans le forum Décisions SGBD
    Réponses: 2
    Dernier message: 04/05/2004, 15h07
  3. Moteur de recherche par date
    Par Prue dans le forum ASP
    Réponses: 17
    Dernier message: 27/08/2003, 16h07
  4. [Technique] Index, comment font les moteurs de recherche ?
    Par bat dans le forum Décisions SGBD
    Réponses: 4
    Dernier message: 25/10/2002, 15h41

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo