IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Schéma Discussion :

Thésaurus et indexation


Sujet :

Schéma

  1. #1
    Membre à l'essai
    Inscrit en
    Février 2008
    Messages
    17
    Détails du profil
    Informations forums :
    Inscription : Février 2008
    Messages : 17
    Points : 11
    Points
    11
    Par défaut Thésaurus et indexation
    Bonjour

    comment on manipule une thesaurus en but d'indexé des document medicale?

    la thésaurus q j vais utilisé est Mesh elle est constitué de 15 domaine , 22995 discripteurs, 83 qualificatifs. la hiearchie de discripteur peut aller à 11 niveau.

    la tache q je doit fair est indexé un corpus de document medicale et faire un moteur de recherche pour y accedé
    la langage à utilisé pr developper cette outille est php

    j'attend votre aide

    merci d'avance

  2. #2
    Rédacteur/Modérateur

    Avatar de Antoun
    Homme Profil pro
    Architecte décisionnel
    Inscrit en
    Octobre 2006
    Messages
    6 281
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6 281
    Points : 11 737
    Points
    11 737
    Par défaut
    Peux-tu nous montrer un extrait de ton thésaurus ?
    Disposes-tu de ton corpus docu en format électronique ?
    Antoun
    Expert Essbase, BO, SQL

    La bible d'Essbase, 2ème édition

  3. #3
    Membre à l'essai
    Inscrit en
    Février 2008
    Messages
    17
    Détails du profil
    Informations forums :
    Inscription : Février 2008
    Messages : 17
    Points : 11
    Points
    11
    Par défaut
    Bonjour

    tout d'abord merci de me repondre

    Ensuite voici un extrait de thésaurus biomedicale Mesh:
    "
    anatomie animale
    bourse de Fabricius
    cloaque
    corps ultimobranchial
    embryons d'espèces non mammifères
    glandes mammaires animales
    membrane nictitante
    membre pelvien
    membre thoracique
    oviductes
    trompes utérines
    plumage
    sacs aériens
    appareil locomoteur
    cartilage
    cartilage élastique
    cartilages auriculaires
    cartilages laryngés
    cartilage aryténoïde
    cartilage cricoïde
    cartilage thyroïde
    épiglotte
    cartilage hyalin
    cartilage articulaire
    cartilages laryngés
    cartilage aryténoïde
    cartilage cricoïde
    cartilage thyroïde
    épiglotte
    septum nasal
    fibrocartilage
    disque intervertebral
    ménisques de l'articulation du genou
    fascia
    ligaments
    ligament large de l'utérus
    ligaments articulaires
    ligament croisé antérieur
    ligament croisé postérieur
    ligament patellaire
    ligaments collatéraux
    ligament collatéral tibial du genou
    ligament latéral de la cheville
    muscles
    fibres musculaires
    muscles lisses
    muscles lisses vasculaires
    myomètre
    sphincter inférieur de l'oesophage
    muscles squelettiques
    coiffe des rotateurs
    muscles abdominaux
    muscle droit de l'abdomen
    plancher pelvien
    muscles de la face
    muscles du cou
    muscles du larynx
    muscles du pharynx
    muscles du voile du palais"

    tu voir la thésaurus à partir de ce lien "http://www.chu-rouen.fr/ssf/arborescences.html"

    maintenant j ai pas le corpus mais il est sous format electronique(document word, pdf et ppt)

  4. #4
    Rédacteur/Modérateur

    Avatar de Antoun
    Homme Profil pro
    Architecte décisionnel
    Inscrit en
    Octobre 2006
    Messages
    6 281
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6 281
    Points : 11 737
    Points
    11 737
    Par défaut
    Il va falloir que tu récupères le MeSH sous une forme exploitable en base de données (fichier .CSV, code SQL, etc...). Ça existe forcément, je pense qu'un peu de Google ou de mail devrait te permettre de l'avoir

    Ton indexation doit-elle être manuelle (ou documentaliste lit les docs et choisit les entrées d'index) ou automatique (recherche des termes d'index dans le corps des documents) ?
    Antoun
    Expert Essbase, BO, SQL

    La bible d'Essbase, 2ème édition

  5. #5
    Membre à l'essai
    Inscrit en
    Février 2008
    Messages
    17
    Détails du profil
    Informations forums :
    Inscription : Février 2008
    Messages : 17
    Points : 11
    Points
    11
    Par défaut
    L'indexation doit etre automatique c-à-d un petit robot ou "spider" d'indexation

  6. #6
    Rédacteur/Modérateur

    Avatar de Antoun
    Homme Profil pro
    Architecte décisionnel
    Inscrit en
    Octobre 2006
    Messages
    6 281
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6 281
    Points : 11 737
    Points
    11 737
    Par défaut
    Dans ce cas, voici la démarche que je te propose :
    1. créer une base de données avec une table Thesaurus contenant tous les termes à indexer, et deux tables vides : Documents(idDoc, NomDoc, Contenu) et Indexation(idTerme, idDoc).
    2. faire une moulinette Word VBA et une autre PowerPoint VBA qui ouvrent tes doc, les lisent, et alimentent la table Documents ; pour PDF, je sais que c'est faisable, mais je ne sais pas du tout comment
    3. Mettre en place une indexation FULLTEXT sur la table Documents (MySQL, SQL Server et Oracle la proposent, pour les autres je ne sais pas trop)
    4. Faire un INSERT INTO Indexation, avec une jointure du genre Documents.Contenu contient le mot-clé Thesaurus.Terme
    Antoun
    Expert Essbase, BO, SQL

    La bible d'Essbase, 2ème édition

  7. #7
    Membre à l'essai
    Inscrit en
    Février 2008
    Messages
    17
    Détails du profil
    Informations forums :
    Inscription : Février 2008
    Messages : 17
    Points : 11
    Points
    11
    Par défaut
    Bonjour,

    merci pour me repondre.

    j veut quelque explication si te permet; pour la table thésaurus, j stocke tout les termes sans prendre en compte les relations entre eux?
    aussi pr utiliser ces termes pr l'indexation, la comparaison entre les termes de thésaurus et celles de document prend beaucoup de temps?

    ces sont mes soucis, peut etre j'ai mal compris. Je voudrais un peu d'explication SVP.

    encore une fois merci de me repondre.

  8. #8
    Rédacteur/Modérateur

    Avatar de Antoun
    Homme Profil pro
    Architecte décisionnel
    Inscrit en
    Octobre 2006
    Messages
    6 281
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6 281
    Points : 11 737
    Points
    11 737
    Par défaut
    Citation Envoyé par LaGazelle Voir le message
    Bonjour,

    j veut quelque explication si te permet; pour la table thésaurus, j stocke tout les termes sans prendre en compte les relations entre eux?
    comme tu veux ! en gros, la hiérarchie des termes ne sera d'aucun utilité pour l'indexation (la recherche des termes dans les docs). Par contre, j'imagine que tu souhaites ensuite pouvoir présenter ton résultat avec la hiérarchie du thésaurus, ce qui suppose qu'effectivement tu l'aies matérialisée, par exemple par une auto-jointure.
    Citation Envoyé par LaGazelle Voir le message
    aussi pr utiliser ces termes pr l'indexation, la comparaison entre les termes de thésaurus et celles de document prend beaucoup de temps?
    Avec un système qui gère l'indexation FULLTEXT, non. A mon sens, le plus difficile dans tous cela, ce sera d'extraire le contenu de tes fichiers.
    Antoun
    Expert Essbase, BO, SQL

    La bible d'Essbase, 2ème édition

  9. #9
    Membre à l'essai
    Inscrit en
    Février 2008
    Messages
    17
    Détails du profil
    Informations forums :
    Inscription : Février 2008
    Messages : 17
    Points : 11
    Points
    11
    Par défaut
    j recoure à la hiérarchie des termes pour recuperer les relation semantique entre les different termes et pour q j peut ecarter l'utilisation des outilles d'analyse grammaticale et syntaxique.
    qu'on pense tu?

  10. #10
    Rédacteur/Modérateur

    Avatar de Antoun
    Homme Profil pro
    Architecte décisionnel
    Inscrit en
    Octobre 2006
    Messages
    6 281
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6 281
    Points : 11 737
    Points
    11 737
    Par défaut
    euh... rien compris !
    Antoun
    Expert Essbase, BO, SQL

    La bible d'Essbase, 2ème édition

  11. #11
    Membre à l'essai
    Inscrit en
    Février 2008
    Messages
    17
    Détails du profil
    Informations forums :
    Inscription : Février 2008
    Messages : 17
    Points : 11
    Points
    11
    Par défaut
    la hiérarchie des termes présentés par la thésaurus MeSH me permet de connaitre les termes qui appartiennent au meme categorie, les termes synonymes , les terme equivalent....
    tout ses relation on peut les extraire de fichier de MeSh en format XML
    a qoui sert ses relation entre les termes? par exemple si l'utilisateur demande dans sa requette "radio" les document contenant ce terme doit etre present dabs le resultat de recherche mais aussi les document contenant les termes "radiologie", "radiographie", "scannar"...
    j'espére que c'est clair maintenant?
    je m'excuse de qualité de ma français

  12. #12
    Rédacteur/Modérateur

    Avatar de Antoun
    Homme Profil pro
    Architecte décisionnel
    Inscrit en
    Octobre 2006
    Messages
    6 281
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 53
    Localisation : France, Paris (Île de France)

    Informations professionnelles :
    Activité : Architecte décisionnel
    Secteur : Conseil

    Informations forums :
    Inscription : Octobre 2006
    Messages : 6 281
    Points : 11 737
    Points
    11 737
    Par défaut
    C'est clair... mais quelle est ta question ?
    Antoun
    Expert Essbase, BO, SQL

    La bible d'Essbase, 2ème édition

  13. #13
    Membre à l'essai
    Inscrit en
    Février 2008
    Messages
    17
    Détails du profil
    Informations forums :
    Inscription : Février 2008
    Messages : 17
    Points : 11
    Points
    11
    Par défaut
    Ma probléme est que je n'arrive pas à trouver une relation entre la table document (docID,termeID,poids) et les tables stockant la hiérarchie des termes. c vrai que j'ai le termeID mais comment je génére les termes en relation avec ce lui ci?
    j'ai besoin de ses relations pour par exemple l'utilisateur demande dans sa requette "radio" les document contenant ce terme doit etre present dabs le resultat de recherche mais aussi les document contenant les termes "radiologie", "radiographie", "scannar"...
    mes idéés sont désordonnés

Discussions similaires

  1. thésaurus pour indexé
    Par LaGazelle dans le forum EDI, CMS, Outils, Scripts et API
    Réponses: 1
    Dernier message: 17/02/2008, 19h18
  2. Message 'Duplicate index entry'
    Par Poulou dans le forum Administration
    Réponses: 13
    Dernier message: 04/05/2004, 14h57
  3. Index n'est pas a jour
    Par touhami dans le forum Paradox
    Réponses: 5
    Dernier message: 11/12/2002, 14h47
  4. [Technique] Intérêt des index
    Par ddams dans le forum Décisions SGBD
    Réponses: 10
    Dernier message: 04/11/2002, 15h11
  5. Requête imbriquée et indexes INTERBASE
    Par vadim dans le forum InterBase
    Réponses: 2
    Dernier message: 06/09/2002, 16h15

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo