IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Algorithmes et structures de données Discussion :

algorithme modele de langage


Sujet :

Algorithmes et structures de données

  1. #1
    Membre régulier
    Profil pro
    Étudiant
    Inscrit en
    Juin 2007
    Messages
    131
    Détails du profil
    Informations personnelles :
    Âge : 34
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2007
    Messages : 131
    Points : 106
    Points
    106
    Par défaut algorithme modele de langage
    Bonsoir a tous,
    pour mon projet de fin d'etude je dois réaliser un programme qui analyse un texte et qui enregistre chaque trigramme (suite de trois mots) dans un tableau trié ainsi que le nombre d'occurences de chacun.

    Le probleme est qu'il me faut également trouver un autre moyen pour stocker et gérer ces trigrammes ainsi que leur insertion et recherche pour que la complexité soit moindre.

    Auriez-vous une idée ?

    is your friend !! passer 20minutes a chercher permet parfois d'eviter de s'enerver en attendant une reponse pendant une heure... si, si je vous jure
    La bidouille s'avère souvent assez efficace : pensez-y en plus vous serez fiers de vous
    pensez à

  2. #2
    Modérateur
    Avatar de Obsidian
    Homme Profil pro
    Développeur en systèmes embarqués
    Inscrit en
    Septembre 2007
    Messages
    7 368
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Développeur en systèmes embarqués
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2007
    Messages : 7 368
    Points : 23 620
    Points
    23 620
    Par défaut
    Citation Envoyé par kevinou55 Voir le message
    Bonsoir a tous,
    Bonjour,

    pour mon projet de fin d'etude je dois réaliser un programme qui analyse un texte et qui enregistre chaque trigramme (suite de trois mots) dans un tableau trié ainsi que le nombre d'occurences de chacun.
    En quel langage ?

    Comment faut-il interpréter ce texte ? Est-ce que dans « un deux trois quatre cinq six », les trigrammes doivent être « un-deux-trois » et « quatre-cinq-six », ou bien faut-il prendre en compte également « deux-trois-quatre » et « trois-quatre-cinq » ?

    Le probleme est qu'il me faut également trouver un autre moyen pour stocker et gérer ces trigrammes ainsi que leur insertion et recherche pour que la complexité soit moindre. Auriez-vous une idée ?
    Il faut surtout que tu sois d'abord au clair sur la manière dont il faut TRIER ces trigrammes. Est-ce qu'ils doivent être manipulés comme s'ils formaient un seul long mot ou y a-t-il d'autres considérations à prendre en compte ?

    Après, je dirais : tri par insertion, liste chaînée, et fonction de hachage. Pour la recherche, tu peux utiliser une approche ordinaire par dichotomie mais si tu connais l'ensemble des signes de tes mots (des lettres ?), tu peux aussi faire plusieurs listes pour classer directement les trigrammes qui commencent par un signe donné (comme les volumes d'un dictionnaire).

  3. #3
    Membre régulier
    Profil pro
    Étudiant
    Inscrit en
    Juin 2007
    Messages
    131
    Détails du profil
    Informations personnelles :
    Âge : 34
    Localisation : France, Meurthe et Moselle (Lorraine)

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2007
    Messages : 131
    Points : 106
    Points
    106
    Par défaut
    Bonjour,
    Il faudra que je code tout ca en java.

    En effet pour "un deux trois quatre cinq six" il faudra stocker "un deux trois" et "deux trois quatre" et ainsi de suite...

    Pour le stockage, il faudrait un tableau de structures ayant dans chaque case [mot1, mot2, mot3, nbOccurences]

    Concernant le tri, je voudrais tout d'abord trier sur le premier mot puis le deuxième et enfin sur le troisième

    il faut également tenir compte que mon prof risque d'avoir un texte de plus de 50.000 caractères pour tester l'appli.

    Je recherche en fait une autre structure qu'un tableau si cela existe pour améliorer la complexité.

    Merci de ton aide
    Cordialement.

    is your friend !! passer 20minutes a chercher permet parfois d'eviter de s'enerver en attendant une reponse pendant une heure... si, si je vous jure
    La bidouille s'avère souvent assez efficace : pensez-y en plus vous serez fiers de vous
    pensez à

  4. #4
    Modérateur
    Avatar de Obsidian
    Homme Profil pro
    Développeur en systèmes embarqués
    Inscrit en
    Septembre 2007
    Messages
    7 368
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 47
    Localisation : France, Essonne (Île de France)

    Informations professionnelles :
    Activité : Développeur en systèmes embarqués
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Septembre 2007
    Messages : 7 368
    Points : 23 620
    Points
    23 620
    Par défaut
    Cyrine a eu le même problème, ici.

    Ce qu'il te faut dans un premier temps, c'est trois buffers (des String si tu travailles en Java) pour tenir trace des trois derniers mots reconnus en permanence. Pour éviter d'avoir à les faire circuler, tu fais un tableau de trois chaînes, tu comptes les mots et tu stockes toujours le mot courant dans chaine[compte % 3]. De cette manière, tu obtiens automatiquement « un-deux-trois » puis « deux-trois-quatre », etc.

    Ensuite, si tu tries sur le premier mot, puis le second et enfin le troisième, il te suffit de les concaténer dans une chaîne unique de traiter celle-ci comme un mot ordinaire.

    Après, tu utilises une Map, avec ton mot comme clé et le nombre d'occurence par valeur.

Discussions similaires

  1. Feature Model, le langage FAMILIAR
    Par thouraya24 dans le forum Eclipse Modeling
    Réponses: 0
    Dernier message: 05/11/2013, 23h33
  2. Réponses: 3
    Dernier message: 17/06/2006, 14h35
  3. Un Pseudo-langage pour les algorithmes
    Par Terminator dans le forum Algorithmes et structures de données
    Réponses: 19
    Dernier message: 24/02/2006, 10h28

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo