IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Delphi Discussion :

Idée pour extraire les mots intéressant d’un texte !


Sujet :

Delphi

  1. #1
    Membre éprouvé Avatar de der§en
    Homme Profil pro
    Chambord
    Inscrit en
    Septembre 2005
    Messages
    765
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : Chambord
    Secteur : Transports

    Informations forums :
    Inscription : Septembre 2005
    Messages : 765
    Points : 960
    Points
    960
    Par défaut Idée pour extraire les mots intéressant d’un texte !
    Bonjour,

    Je cherche une idée / algo pour extraire les mots intéressant (pas les verbes, plutôt les mots technique) d’un texte afin de favoriser le classement et la recherche.

    Auriez-vous une idée / suggestion, pour m’orienter vers une solution ?

    Merci d’avances de vos retours.

  2. #2
    Expert éminent sénior
    Avatar de ShaiLeTroll
    Homme Profil pro
    Développeur C++\Delphi
    Inscrit en
    Juillet 2006
    Messages
    13 459
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 43
    Localisation : France, Seine Saint Denis (Île de France)

    Informations professionnelles :
    Activité : Développeur C++\Delphi
    Secteur : High Tech - Éditeur de logiciels

    Informations forums :
    Inscription : Juillet 2006
    Messages : 13 459
    Points : 24 873
    Points
    24 873
    Par défaut
    En fait, le plus simple c'est plutôt de constituer la blacklist des pronom personnel (le, la, les), les conjonctions de coordination (mais ou est donc or ni car) ... tu as quoi 150 mots dedans.

    Le reste, tu extraits les mots, tu peux les nettoyer au passage, suppression accent, suppression ligature, passage en majuscule.
    Tu stockes un grand index de mot et une table de jointure pour indiquer dans quel texte c'est à quel endroit.

    Lors de la recherche, tu appliques le même nettoyage sur les mots recherchés.



    C'est une technique très simple voire simpliste de la recherche Full Text, il y a bien mieux mais mathématiquement plus compliqué.
    Par exemple, il y a des outils comme SolR ou ElasticSearch (on a remplacé le second par le premier dans nos outils)


    Demain, je pourrais te donner un zip de 2004 où j'ai fait ce travail sur les fichiers NX CCAM.
    J'ai construit l'indexation des mots lié à l'arbre des nomenclatures CCAM.
    Aide via F1 - FAQ - Guide du développeur Delphi devant un problème - Pensez-y !
    Attention Troll Méchant !
    "Quand un homme a faim, mieux vaut lui apprendre à pêcher que de lui donner un poisson" Confucius
    Mieux vaut se taire et paraître idiot, Que l'ouvrir et de le confirmer !
    L'ignorance n'excuse pas la médiocrité !

    L'expérience, c'est le nom que chacun donne à ses erreurs. (Oscar Wilde)
    Il faut avoir le courage de se tromper et d'apprendre de ses erreurs

  3. #3
    Rédacteur/Modérateur
    Avatar de Andnotor
    Inscrit en
    Septembre 2008
    Messages
    5 695
    Détails du profil
    Informations personnelles :
    Localisation : Autre

    Informations forums :
    Inscription : Septembre 2008
    Messages : 5 695
    Points : 13 131
    Points
    13 131
    Par défaut
    Ou peut-être l'inverse : chercher les mots précédés par le, la, un, des, ... (pronoms ou nombres).

  4. #4
    Membre éprouvé Avatar de der§en
    Homme Profil pro
    Chambord
    Inscrit en
    Septembre 2005
    Messages
    765
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : Chambord
    Secteur : Transports

    Informations forums :
    Inscription : Septembre 2005
    Messages : 765
    Points : 960
    Points
    960
    Par défaut
    @ShaiLeTroll: je suis intéresser par le code proposé.

    @Andnotor: je vais aussi voir ce que pourrais donner ton approche.

    Merci pour vos pistes que je vais creuser

Discussions similaires

  1. Réponses: 2
    Dernier message: 30/01/2012, 10h40
  2. Extraire les mots d'un fichier texte
    Par krokmitaine dans le forum Windows Forms
    Réponses: 7
    Dernier message: 20/06/2007, 10h38
  3. Réponses: 2
    Dernier message: 22/11/2006, 12h09
  4. Extraire les mots d'un texte
    Par krachik dans le forum C
    Réponses: 9
    Dernier message: 11/05/2006, 22h16
  5. Pour extraire les données d'un fichier texte
    Par Floch dans le forum Access
    Réponses: 2
    Dernier message: 02/05/2006, 15h01

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo