IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage Perl Discussion :

Besoin de vos avis sur un algo


Sujet :

Langage Perl

  1. #1
    Membre régulier
    Profil pro
    Inscrit en
    Décembre 2004
    Messages
    210
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2004
    Messages : 210
    Points : 99
    Points
    99
    Par défaut Besoin de vos avis sur un algo
    Bonjour, j'ai une quantité énorme de fichiers a analysés en différente langue , je voudrais m'en servire pour faire un algo qui reposant sur des empreintes numérique permette de trouver la langue dans laquel est rédigé un texte.

    Voici comment je voie la chose

    Extraction du texte => On découpe en segment de mille mots (split ' ') => on passe le texte en minuscule => On génère pour chaque mot une empreinte que l'on compare a une base de donnée d'empreintes , l'algo cherche de quelle(s) empreinte(s) le texte est le plus proche et détermine ainsi la langue.
    Je compte passé pas crypt() pour créer les empreintes.

    J'aimerai savoir si le fonctionnement théorique de l'algo vous parais bon, si non quel améliorations ont pourrai y apporté.

    De plus si je passe le texte en minuscule et que le texte en question est en japonais cela ne risque t'il pas de poser problème ?

    merci .

  2. #2
    Expert éminent
    Avatar de Jedai
    Homme Profil pro
    Enseignant
    Inscrit en
    Avril 2003
    Messages
    6 245
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Côte d'Or (Bourgogne)

    Informations professionnelles :
    Activité : Enseignant

    Informations forums :
    Inscription : Avril 2003
    Messages : 6 245
    Points : 8 586
    Points
    8 586
    Par défaut
    Le passage par l'empreinte est inutile, autant comparer directement les mots, ça ira plus vite.
    Si tu cherches à améliorer ton algo précédent, il existe une méthode qui repose sur la fréquence des trigrammes (série de 3 lettres consécutives) dans ton texte, et avec laquelle on peut obtenir d'excellent résultat en très peu de caractères.

    --
    Jedaï

  3. #3
    Membre régulier
    Profil pro
    Inscrit en
    Décembre 2004
    Messages
    210
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Décembre 2004
    Messages : 210
    Points : 99
    Points
    99
    Par défaut
    Ok merci je vais me renseigner sur ces trigrammes

    Sa semble pas mal en effet les trigrammes , j'ai vue qu'il en existe près de 1600 en français !

    Existe t'il des listes de trigramme dispo sur le net car j'ai cherché et rien trouvé !

    Ou je doit arreter de chercher et me faire un algo qui fasse sa bien ?

Discussions similaires

  1. Besoin de vos avis sur exchange
    Par joke000 dans le forum Exchange Server
    Réponses: 5
    Dernier message: 19/05/2010, 14h46
  2. Réponses: 2
    Dernier message: 28/08/2008, 13h03
  3. Besoin de vos avis sur www.bymusic.fr
    Par jonbymusic dans le forum Mon site
    Réponses: 12
    Dernier message: 25/03/2007, 08h39
  4. Besoin de vos avis éclairé sur ma base de données
    Par scaleo dans le forum MS SQL Server
    Réponses: 1
    Dernier message: 20/12/2005, 18h36

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo