IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Schéma Discussion :

Modèle d'une base de méta-données [MCD]


Sujet :

Schéma

  1. #1
    Membre habitué
    Homme Profil pro
    Data Manager
    Inscrit en
    Octobre 2013
    Messages
    151
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire (Rhône Alpes)

    Informations professionnelles :
    Activité : Data Manager
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2013
    Messages : 151
    Points : 167
    Points
    167
    Par défaut Modèle d'une base de méta-données
    Bonjour à toutes et à tous,

    Le contexte

    Je travaille en recherche clinique. On me demande de concevoir les bases des études que nous gérons.

    Pour faire vite et en première approximation, une étude est organisée par un promoteur (personne morale), sur l’idée d’un médecin investigateur. D’autres médecins investigateurs aident celui qui a eu l’idée à recruter des patients. L’étude est encadrée par un chef de projet entouré d’assistant de recherche clinique, de technicien en étude clinique, de méthodologiste, de statisticien, etc… J’ai mis toutes les fonctions au singulier mais pour certaines on peut avoir plusieurs personnes.

    Les données sont recueillies grâce à un cahier d'observation. Mon travail est de "transformer" ce cahier en une base de données.

    Un cahier d'observation est constitué de bordereaux. Les bordereaux correspondent généralement aux étapes de l’expérimentation : visite d’inclusion, chirurgie, visite n°1 post chirurgie, visite n°2, visite de fin d’étude, etc… Chaque bordereau se divise en paragraphe et chaque paragraphe en question. Pour chaque question une seule réponse est possible (exigence des bonnes pratiques en recherche clinique). Les réponses aux questions peuvent être des textes, des nombres, des listes de choix à réponse unique ou des dates.

    Tout ceci est donc très structuré selon un modèle assez robuste. J’ai l’impression que les bases des études vont donc être développées sur le même modèle.
    Du coup, je me suis dit qu’au lieu de rédiger un cahier d’observation, puis un questionnaire de variables associant à chaque question un nom de variable, un type, des bornes inférieures et supérieures, etc…, puis de recopier les infos du dictionnaire dans la base de données de l’étude, je me suis donc dit qu’il pourrait être préférable de ne faire qu’un seul outil à partir duquel tous les documents soient générés : le cahier d’observation, le dictionnaire de variables et la structure de la base de l’étude (au moins les tables et leurs variables, idéalement les formulaires associés). D’où l’idée d’une base de méta-données des études.

    Donc pour cette base, les données de ma base sont (entre autre, je ne parle plus des personnes impliquées, de la division en bordereau et paragraphe) les questions de l'étude et leur réponse. Par exemple question : Température. Sa réponse est un nombre à 3 chiffres dont une décimale, l'unité est le degré Celsius représenté par "°". Le nombre est compris entre 30 et 44°. Quand je veux faire apparaitre la question et la réponse dans le cahier d’observation, je veux quelque chose ressemblant à Température (en °C) : |__|__|,|__| et dans le formulaire de la base associée une variable x dont le libellé est "Température (en °C)". x est un numérique à 3 chiffres dont 1 décimale et borné.

    Autre exemple de question :
    Etiologie dont la réponse est Etiologie1 codée par 1, Etiologie2 codée par 2, Etiologie3 codée par 3 et Etiologie4 codée par 4 (comme dit plus haut il n'est pas possible d'avoir plusieurs réponses à une seule question, c'est dans les procédures). Je veux que le choix de la réponse apparaisse dans une liste déroulante.

    Autre exemple : Date de naissance (JJ/MM/AAAA) : |__|__|/|__|__|/|__|__|__|__| avec les limites appropriées.

    Je peux aussi avoir des questions du type "Expliquez : ................................................................................"

    On a aussi des questions à tiroirs, du type :
    "Avez-vous pris le traitement A ? Oui/Non
    Si oui quelle dose (en mg) ? |__|__|__|__|
    Sinon avez-vous oublié ? Oui/Non"

    Voilà donc le point de départ.

    Le modèle

    J’ai donc essayé de modéliser cette situation selon le schéma suivant.
    Nom : Diag_Etude.png
Affichages : 1704
Taille : 109,7 Ko

    J’ai créé une entité réponse dont les attributs sont les caractéristiques d’une réponse indépendamment de son type (numérique, texte, date, heure, etc…) et des entités spécialisées reprenant les caractéristiques propres au type de la réponse.

    Est-ce que ce schéma vous semble modéliser correctement la situation décrite ci-dessus ? Avez-vous repéré des erreurs grossières, celles que l’on pardonne aux débutants ? Ah non ? On ne pardonne pas ? Oupsss…

    Merci d’avance pour vos réponses !

    Laurent

  2. #2
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    À première vue et vite fait, ça semble pas mal du tout.

    Détails ne concernant pas les méta-données...

    1) Nommez vos entités types au singulier car elles sont issues des règles de gestion qui décrivent ce qui se passe successivement pour 1 instance de chaque entité type.

    2) Externalisez les références
    Par exemple, les types de téléphone, les types de broderaux, les titres des personnes, mais aussi les villes afin d'éviter d'avoir la même ville avec des orthographes différentes et pour éviter d'enregistrer plusieurs fos la même ville. Posez vous aussi la question pour le financement de l'étude s'il s'agit d'un type répétitif de financement.

    3) Ne faudrait-il pas aussi modéliser le promoteur dans une entité-type séparée ?
    Une même personne morale ne peut-elle être promoteur de plusieurs études ?
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  3. #3
    Membre habitué
    Homme Profil pro
    Data Manager
    Inscrit en
    Octobre 2013
    Messages
    151
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire (Rhône Alpes)

    Informations professionnelles :
    Activité : Data Manager
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2013
    Messages : 151
    Points : 167
    Points
    167
    Par défaut
    Bonjour,

    Citation Envoyé par CinePhil Voir le message
    À première vue et vite fait, ça semble pas mal du tout.
    Merci !

    Citation Envoyé par CinePhil Voir le message
    1) Nommez vos entités types au singulier car elles sont issues des règles de gestion qui décrivent ce qui se passe successivement pour 1 instance de chaque entité type.
    Ah ! J'avais cru comprendre, à tort manifestement, que la convention était de mettre au pluriel les titres des entités puisqu'elles correspondent à plusieurs enregistrements du même type. Voilà pourquoi je me suis attaché à tout mettre au pluriel.

    Citation Envoyé par CinePhil Voir le message
    2) Externalisez les références
    Par exemple, les types de téléphone, les types de broderaux, les titres des personnes, mais aussi les villes afin d'éviter d'avoir la même ville avec des orthographes différentes et pour éviter d'enregistrer plusieurs fos la même ville. Posez vous aussi la question pour le financement de l'étude s'il s'agit d'un type répétitif de financement.
    Bien vu ! Effectivement je n'avais pas pensé à ça. Par contre je n'externaliserai pas les types de bordereaux parce que ils peuvent changer d'une étude à l'autre. Certains sont communs à la plupart des études (voire à toutes) mais la plupart dépend de l'étude.


    Citation Envoyé par CinePhil Voir le message
    3) Ne faudrait-il pas aussi modéliser le promoteur dans une entité-type séparée ?
    Une même personne morale ne peut-elle être promoteur de plusieurs études ?
    Oui aussi, le promoteur pourrait tout à fait être dans une entité séparée. Oui un promoteur est très généralement responsable de plusieurs études.

    Merci pour ces bons conseils et pour votre aide.

    A ceux qui partent en vacances, bonnes vacances !
    Aux autres, bon courage en attendant votre tour ! :-)

    Laurent

  4. #4
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    Citation Envoyé par laurent_42 Voir le message
    Ah ! J'avais cru comprendre, à tort manifestement, que la convention était de mettre au pluriel les titres des entités puisqu'elles correspondent à plusieurs enregistrements du même type. Voilà pourquoi je me suis attaché à tout mettre au pluriel.
    C'est une erreur d'interprétation fréquente.

    Écrivons une règle de gestion :
    Un projet contient une à plusieurs études et une étude est contenue dans un seul projet.

    Je décris bien ici ce qui se passe pour UN projet et UNE étude.

    J'en déduis que j'aurai les entités-types suivantes : Projet et Etude.

    Et lorsque je vais déterminer quelles seront les propriétés de ces entités types, je vais de nouveau me poser la question de ce qui caractérise UN projet et UNE étude.

    Sémantiquement, c'est plus juste et le pluriel peut prêter à confusion et laisser penser qu'une instance de l'entité-type ou qu'une propriété représente un ensemble, c'est à dire que l'objet est multi-valué, ce qui est contraire à l'atomicité des informations stockées dans la base de données.



    Bien vu ! Effectivement je n'avais pas pensé à ça. Par contre je n'externaliserai pas les types de bordereaux parce que ils peuvent changer d'une étude à l'autre. Certains sont communs à la plupart des études (voire à toutes) mais la plupart dépend de l'étude.
    Ce serait une erreur de ne pas externaliser les types de borderaux !
    Vous dites vous-même des bordereaux "sont communs à la plupart des études (voire à toutes)", ce qui démontre bien qu'il y a une association de plusieurs à plusieurs entre les types de bordereaux et les études. En fait, il s'agit plutôt d'une association de un à plusieurs entre les bordereaux et les types de bordereaux.

    Règle de gestion :
    Un bordereau est d'un seul type de bordereau et un type de bordereau peut qualifier plusieurs bordereaux.

    MCD :
    bordereau -1,1----qualifier----0,n- type_bordereau
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  5. #5
    Membre habitué
    Homme Profil pro
    Data Manager
    Inscrit en
    Octobre 2013
    Messages
    151
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire (Rhône Alpes)

    Informations professionnelles :
    Activité : Data Manager
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2013
    Messages : 151
    Points : 167
    Points
    167
    Par défaut
    Bonjour,

    Citation Envoyé par CinePhil Voir le message
    C'est une erreur d'interprétation fréquente.
    ...
    Sémantiquement, c'est plus juste et le pluriel peut prêter à confusion et laisser penser qu'une instance de l'entité-type ou qu'une propriété représente un ensemble, c'est à dire que l'objet est multi-valué, ce qui est contraire à l'atomicité des informations stockées dans la base de données.
    Merci pour cette explication et ces précisions. Je veillerai à éviter cette confusion désormais.

    Citation Envoyé par CinePhil Voir le message
    Ce serait une erreur de ne pas externaliser les types de borderaux !
    Vous dites vous-même des bordereaux "sont communs à la plupart des études (voire à toutes)",
    Oui effectivement j'ai écrit que certains types de bordereau étaient communs à la plupart des études. Il s'agit des bordereaux que l'on retrouve dans toutes les études : visite d'inclusion (et encore, on peut en discuter), décès, événements indésirables. Tous les autres dépendent de l'étude et de ses caractéristiques. Je suis dans l'impossibilité de prévoir les types de bordereaux des futures études. Je ne comprends pas pourquoi et comment externaliser cette donnée de l'étude.

    Peut-être que le problème vient de notre choix du nom de l'attribut "Type de bordereau" sans aucun doute trompeur. En fait c'est une espèce d'acronyme du titre du bordereau, un code dont la définition ne répond pas à une règle précise et systématique (ça serait trop simple... ), code qui remplace le titre qui peut-être parfois long et détaillé. D'ailleurs si j'externalise le type de bordereau, je devrais selon la même logique externalisé le titre du bordereau.

    Citation Envoyé par CinePhil Voir le message
    Règle de gestion :
    Un bordereau est d'un seul type de bordereau et un type de bordereau peut qualifier plusieurs bordereaux.

    MCD :
    bordereau -1,1----qualifier----0,n- type_bordereau
    Oui oui tout à fait, je suis bien d'accord avec ça. Mais c'est aussi vrai pour le titre. Donc pourquoi n'externaliser que le type de bordereau ?

    On peut d'ailleurs presque considérer que le titre et le type de bordereau sont redondants. Mais selon son métier, l'intervenant aura besoin du titre (par exemple le médecin ou le chef de projet) ou du type (par exemple le statisticien). Nous n'avons pas de règle pour passer de l'un à l'autre. Il me semblerait d'ailleurs difficile d'en proposer une qui soit complète. Je n'ai donc pas trouvé d'autres solutions que d'avoir ces 2 données.

    A bientôt
    Laurent

  6. #6
    Membre habitué
    Homme Profil pro
    Data Manager
    Inscrit en
    Octobre 2013
    Messages
    151
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire (Rhône Alpes)

    Informations professionnelles :
    Activité : Data Manager
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2013
    Messages : 151
    Points : 167
    Points
    167
    Par défaut
    Bonjour,

    Je me permets de revenir sur cette question d'externalisation juste pour savoir si je n'ai rien compris au truc ou si c'est que je m'étais mal expliqué la fois précédente.

    Merci d'avance pour vos réponses.

    Bien à vous,

    Laurent

  7. #7
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    Il faudrait que tu nous précises davantage ce qu'est un bordereau.

    Si je prends un autre contexte, plus général, il peut y avoir des types de documents (bon de livraison, fiche d'anomalie, demande de congés, fiche de retrait en stock, fiche de modification...) et les documents eux-mêmes (bon de livraison n° 1234 de 10 luminaires à tel client pour telle affaire, fiche d'anomalie n° 124 sur le chantier 824...).
    Chaque document est donc d'un certain type.
    Si ces types de documents sont informatisés, ils auront chacun des propriétés différentes mais tous les bons de livraison auront les mêmes propriétés, toutes les fiches d'anomalie auront les mêmes propriétés...
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  8. #8
    Membre habitué
    Homme Profil pro
    Data Manager
    Inscrit en
    Octobre 2013
    Messages
    151
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire (Rhône Alpes)

    Informations professionnelles :
    Activité : Data Manager
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2013
    Messages : 151
    Points : 167
    Points
    167
    Par défaut
    Re-bonjour,

    Dans le contexte de la recherche clinique, avec notre terminologie et de manière très générale, une étude est divisée en plusieurs phases : la visite initiale, le traitement au sens large (ça peut être une chirurgie, un traitement médicamenteux, l'installation d'un dispositif médical, etc...), les visites de suivi du patient dans le but de juger la sécurité et l'efficacité du traitement. On est d'accord que c'est le cas d'école, je reste sur un schéma très général sans rentrer dans les détails.

    Le nombre de visites initiales, le nombre de traitement donné, le nombre de visites de suivi dépendent de l'étude, du plan d'analyse, etc... On peut avoir une visite initiale, un traitement A, 2 visites de suivi, une nouvelle visite initiale, un traitement B, 2 visites de suivi et une visite de fin d'étude. Ou alors une visite initiale, un traitement, 10 visites de suivi. Bref ce n'est jamais la même chose.
    Au cours de ces phases on collecte les données de l'étude. Les données ne sont jamais les mêmes non plus.

    Outre ces différentes phases, on recueille aussi les événements médicaux qui ont lieu pendant l'étude. Ca peut être une hospitalisation, une visite chez le généraliste, une transfusion sanguine, l'arrêt d'un traitement, etc... Certains patients feront des événements, d'autres non. Là encore les événements dépendent de l'étude, on ne recueille jamais les mêmes infos.

    Pour structurer toutes ces données, on les regroupe par parties qui correspondent au déroulement de l'étude. Parfois à chaque phase ou chaque événement de l'étude correspond une partie (par exemple la visite de suivi n°2), parfois, une phase peut être découpée en plusieurs parties (par exemple la visite de suivi n°3 et les résultats du test médical fait à l'occasion de la visite de suivi n°3).

    Le bordereau est ce qui correspond à ces parties.
    Matériellement c'est une ou plusieurs pages du cahier où sont notées les informations.

    En pièce jointe, vous trouverez un exemple d'un bordereau. On retrouve l'acronyme de l'étude, le type de bordereau, le titre du bordereau et un paragraphe du bordereau.

    Le type est presque un acronyme du titre du bordereau.

    Voilà, j'espère avoir été plus et assez clair...

    A bientôt
    Laurent
    Images attachées Images attachées

  9. #9
    Membre habitué
    Homme Profil pro
    Data Manager
    Inscrit en
    Octobre 2013
    Messages
    151
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire (Rhône Alpes)

    Informations professionnelles :
    Activité : Data Manager
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2013
    Messages : 151
    Points : 167
    Points
    167
    Par défaut
    Bonjour,

    Même s'il reste quelques points pas très clair pour moi, je passe la discussion en résolu.

    Mais si vous avez des compléments à apporter, je suis preneur, ça me permettra d'apprendre et de comprendre encore un peu plus.

    Quoiqu'il en soit merci beaucoup à toutes et à tous, avec une mention spéciale pour CinePhil !

    Laurent

  10. #10
    Modérateur

    Avatar de CinePhil
    Homme Profil pro
    Ingénieur d'études en informatique
    Inscrit en
    Août 2006
    Messages
    16 799
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 60
    Localisation : France, Haute Garonne (Midi Pyrénées)

    Informations professionnelles :
    Activité : Ingénieur d'études en informatique
    Secteur : Enseignement

    Informations forums :
    Inscription : Août 2006
    Messages : 16 799
    Points : 34 031
    Points
    34 031
    Billets dans le blog
    14
    Par défaut
    Voyez aussi la solution que je préconise dans cette autre discussion. La problématique me semble proche de la votre concernant les bordereaux.
    Philippe Leménager. Ingénieur d'étude à l'École Nationale Supérieure de Formation de l'Enseignement Agricole. Autoentrepreneur.
    Mon ancien blog sur la conception des BDD, le langage SQL, le PHP... et mon nouveau blog sur les mêmes sujets.
    « Ce que l'on conçoit bien s'énonce clairement, et les mots pour le dire arrivent aisément ». (Nicolas Boileau)
    À la maison comme au bureau, j'utilise la suite Linux Mageïa !

  11. #11
    Membre habitué
    Homme Profil pro
    Data Manager
    Inscrit en
    Octobre 2013
    Messages
    151
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Loire (Rhône Alpes)

    Informations professionnelles :
    Activité : Data Manager
    Secteur : Santé

    Informations forums :
    Inscription : Octobre 2013
    Messages : 151
    Points : 167
    Points
    167
    Par défaut
    Bonjour,

    Oui effectivement. Après une lecture rapide, la partie question/réponse semble pouvoir être rapprochée des commentaires/objets commentés. Mais j'ai plus de mal à voir la liaison avec l'externalisation ou non du type de bordereau.

    A bientôt
    Laurent

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Modèle d'une base de méta-données
    Par laurent_42 dans le forum Modélisation
    Réponses: 19
    Dernier message: 18/09/2014, 16h46
  2. Lecture d'une base de de données dbf
    Par asoka13 dans le forum C#
    Réponses: 2
    Dernier message: 03/07/2012, 17h38
  3. Listes des indexes d'une base de de données
    Par The eye dans le forum MS SQL Server
    Réponses: 1
    Dernier message: 11/01/2008, 11h55
  4. Exporter une base sans les données ?
    Par eulalienath dans le forum MS SQL Server
    Réponses: 5
    Dernier message: 23/10/2007, 16h50
  5. trouver le modèle de données d'une base
    Par slausseur dans le forum MS SQL Server
    Réponses: 2
    Dernier message: 02/03/2007, 07h40

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo