Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

+ Répondre à la discussion

Conception Web

Discussion :

Projet de detection de langue pour moteur de recherche

Sujet :

Conception Web

Outils de la discussion
- Afficher une version imprimable
- S'abonner à cette discussion…
Affichage
- Mode linéaire
- Choisir le mode hybride
- Choisir le mode arborescent

05/04/2009, 19h34 #1

didi78

Membre à l'essai

Inscrit en
Novembre 2008
Messages
37
Détails du profil
Informations personnelles :
Localisation : France

Informations forums :
Inscription : Novembre 2008
Messages : 37
Points : 15
Points
15

Projet de detection de langue pour moteur de recherche

Bonjour,

Je suis le concepteur de mooveOn.net un projet de moteur de recherche de vidéos.

J'ai conçu un algorithme simple et efficace de détection de langue,
Imaginez une liste de stopwords (mots communs de la langue) pour le francais cela donnerait :

le
la
un
une
etc. (on part avec 100/200 mots stopwords)

De même pour une trentaine d'autres langues, on parcourt le texte en regardant le nombre d'occurrence de la langue, pour une phrase du genre :
la souris a mangé le chat,
il y a 3 points pour le francais, 0 pour les autres langues, car le, la, a sont des stopwords francais.
Ensuite on ajoute les autres mots dans la bibliothèque des mots de la langue.

Cela semble marcher très bien, mais j'ai réussi à concocter ces stopwords de base pour 6 langues : le francais, l'anglais, l'italien, l'allemand, l'espagnol, le catalan ^^

J'aimerai savoir si certains pourraient nous aider à concocter des stopwords pour les langues qui nous intéressent mais qui pose un sérieux problème :

le chinois
le japonnais
le russe
et d'autres si possible.
Merci à toute la communauté
Et n'hésitez pas à commenter, critiquer ou encore faire les louanges du projet :p

A bientôt, Adrien.

Répondre avec citation 0 0

+ Répondre à la discussion

« Discussion précédente | Discussion suivante »

Discussions similaires

Structure table pour moteur de recherche
Par sunshine33 dans le forum Requêtes

Réponses: 0
Dernier message: 04/02/2008, 14h32
Dictionnaire sémantique pour moteur de recherche?
Par Glavio dans le forum SQL Procédural

Réponses: 0
Dernier message: 20/07/2007, 11h36
Probleme vba pour moteur de recherche ACCESS
Par sylvaindenisbe dans le forum Modélisation

Réponses: 1
Dernier message: 10/05/2007, 14h30
Algorithme d'indexation pour moteur de recherche
Par caspertn dans le forum Algorithmes et structures de données

Réponses: 7
Dernier message: 24/04/2006, 16h57
Problème requete pour moteur de recherche
Par vincedjs dans le forum Requêtes

Réponses: 48
Dernier message: 15/03/2006, 14h47

Partager

Partager

×

Vous avez un bloqueur de publicités installé.

Le Club Developpez.com n'affiche que des publicités IT, discrètes et non intrusives.

Afin que nous puissions continuer à vous fournir gratuitement du contenu de qualité, merci de nous soutenir en désactivant votre bloqueur de publicités sur Developpez.com.