fouille de texte

Version imprimable

10/02/2011, 17h25
jmjmjm

fouille de texte

Bonjour,
Avant tout, je ne savais pas dans quelle rubrique poster, alors merci au "admin" de déplacer le message si ce n'est pas bon.
Je souhaiterais compléter le logiciel de messagerie de mon boulot afin d'effectuer un tri automatique des messages reçue par rubrique :
- spam
- famille
- boulot....

Je ne sais pas trop par ou partir et je viens à la pèche aux infos.
Ce qui existe pour l'instant, tout les messages sont stocké dans une BDD MS-SQLSERVEUR, une table contient les mails avec les champs sujet, corps, pièces jointes (entre autre)

Sur cette table, les champs cité plus haut sont indexé dans un catalogue FULLTEXT, ce qui me permet de faire des recherches instantanés.
Je souhaiterais pouvoir trié mes mails par rapport à des arbres de connaissances SPAM, FAMILLE ....
Je pense que cela se rapproche plus du TEXTMINING que du DATAMINING qu'en pensez vous ??
Comment trié les messages suivant ces arbres ?? Lot SSIS ?? J'aurais aimé le plus en temps reels possible.

Je pensais faire en sorte que ces arbres de connaissances soit évolutif, au fur et à mesure qu'une personne désigne un message comme appartenant à une catégorie l'arbre de connaissance enregistre les mots à indexer pour la categorie.

En gros mes arbres de connaissances seraient des tables, indexé à leur tour. Est ce bon ??

Si vous avez des idées, suggestions, je suis preneur. Merci de m'indiquer si je fais fausse route ou si je suis plutôt bien parti ainsi que les différents moyen que vous utiliseriez pour comparer les mails aux arbres de connaissances. Merci beaucoup
10/02/2011, 19h50
SQLpro

j'ai fait cela à deux reprises :
1) base de knowledge management avec positionnement multi arborescent
2) moteur de texte mining de la société Intellixir à Manosque.

Il faut utiliser les représentations arborescente intervallaire et si possible faire un multi arbre en une seule table.
Lisez les nombreux articles que j'ai écrit sur ce sujet.

Pour le textmining, la le sujet est plus vaste. Si vous êtes en 2008, vous pouvez utiliser les tables système de l'IFTS pour greffer vos propre tables afin d'enrichir la recherche et la fouille, par exemple pour des recherches floues.

A +
10/02/2011, 20h14
jmjmjm

Tout d'abord merci pour la reponse, je m'orientrais plutôt vers la première solution car je ne peux faire appel a des outils externe.

Je suis donc très intéresse par vos articles, ou puis je les trouver ?

Cela reste donc de la fouille de texte, je n'ai pas besoin de morienter vers un processus de datamining avec technologie olap etc...

Car j'ai besoin d'analyser tout les mails par leur pertiance afin de les classer. Il me faudra donc des regles statistiques, puis je les implémenter ici ??

Merci pour la réponse.

Je pourrais vous fournir plus de détails par PV, est ce possible ??

A+
11/02/2011, 00h35
SQLpro

vous trouverez tout sur mon site web et dans mon blog SQL.

A +
11/02/2011, 11h16
jmjmjm

Bonjour, petit message pour vous dire que je trouve plein d'articles intéressants sur votre site et blog mais que je n'ai rien trouvé sur le "knowledge" tout comme sur les arbres, auriez vous un moyen de m'aiguiller dans ma recherche (période à laquelle vous auriez écrit l'article ...)

Par avance merci