IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

stemming en Francais


Sujet :

Algorithmes et structures de données

  1. #1
    Membre actif
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    205
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 205
    Points : 206
    Points
    206
    Par défaut stemming en Francais
    Bonjour,

    Pour monter un moteur de recherche pour un site internet, je souhaiterai savoir si le principe du stemming a été correctement porté en français. En effet, la langue française comporte plus de cas particuliers que la langue anglaise, et le principe du stemming est très peu évoqué en français.

    Je remercie d'avance ceux qui pourrons m'éclairer

  2. #2
    Expert éminent Avatar de Graffito
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    5 993
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 993
    Points : 7 903
    Points
    7 903
    Par défaut
    Bonjour,

    Il y a 2 aspects dans le stemming :
    1. les formes d'un même mot (féminin, pluriel, conjugaison),
    2. les mots de la même famille.

    Pour le 1), le mieux est de créer un dictionnaire en forme complète généré à partir des forme "normale" des mots (masculin, singulier, infinitif) et qui permet de faire correspondre "amusassiez" avec "amuser".

    Pour le 2), ca se corse puisqu'on touche à la sémantique, on peut soit définir par dictionnaire ou algorithme (comme n premiers % des 2 mots identiques) des relations N-N entre formes normales ou faire correspondre les formes normales à des concepts, par exemple : main -> main(anatomie), main(cartes), ...
    " Le croquemitaine ! Aaaaaah ! Où ça ? " ©Homer Simpson

  3. #3
    Membre actif
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    205
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 205
    Points : 206
    Points
    206
    Par défaut
    Merci beaucoup de la reponse!

    Pour le premier cas qui semble le plus simple, le probleme est le fait qu'il faille tout faire a la main...?

    L'ideal finalement serait d'avoir un dictionnaire deja tout feait des correspondances, car avec la methode numero 2, j'ai peur qu'elle ne soit pas entierement fiable et d'y passer beaucoup de temps pour pas grand chose.

    De plus, la deuxieme methode va necessiter du calcul en permanence pour mon application.

    Je dois donc creer un dictionnaire moi meme ou y'en a-t-il deja en francais de disponible? (avec des base de donnees, en arbre ou n'importe quoi, meme si un xml m'arrangerai)

  4. #4
    Expert éminent Avatar de Graffito
    Profil pro
    Inscrit en
    Janvier 2006
    Messages
    5 993
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Janvier 2006
    Messages : 5 993
    Points : 7 903
    Points
    7 903
    Par défaut
    Pour le premier cas qui semble le plus simple, le probleme est le fait qu'il faille tout faire a la main...?
    Il faut :
    a) à la base un dictionnaire des noms, adjectifs et verbes (je ne sais pas où le trouver sur le net autre chose que des listes de mots sans autres caractéristiques).
    b) dévelloper les algorithmes générant les pluriels, féminins et les conjugaisons (ce qui représente 3 à 6 semaines de travail).
    " Le croquemitaine ! Aaaaaah ! Où ça ? " ©Homer Simpson

  5. #5
    Membre actif
    Profil pro
    Inscrit en
    Avril 2008
    Messages
    205
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2008
    Messages : 205
    Points : 206
    Points
    206
    Par défaut
    Si cette liste n'a pas ete faite encore en francais, il pourrait etre interessant de lancer un projet communautaire dans ce but avec a la cle un (tres) gros xml.

    Je vais faire des recherches pour savoir si cela existe.

Discussions similaires

  1. Réponses: 2
    Dernier message: 03/06/2016, 18h20
  2. Debian ou SuSE en francais ?
    Par portu dans le forum Distributions
    Réponses: 10
    Dernier message: 21/09/2003, 23h31
  3. Réponses: 2
    Dernier message: 18/09/2003, 13h46
  4. [langage]Affichage français!!
    Par jpc_50 dans le forum Langage
    Réponses: 5
    Dernier message: 06/01/2003, 18h37
  5. cours directx francais sur delphi
    Par charly dans le forum DirectX
    Réponses: 2
    Dernier message: 28/05/2002, 17h29

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo