IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

MS SQL Server Discussion :

anonymiser des données


Sujet :

MS SQL Server

  1. #1
    Nouveau membre du Club
    Inscrit en
    Novembre 2007
    Messages
    68
    Détails du profil
    Informations forums :
    Inscription : Novembre 2007
    Messages : 68
    Points : 35
    Points
    35
    Par défaut anonymiser des données
    bonjour j'ai un petit souci technique,je cherche à anonymiser les données d'une table de ma base de données en l'occurence elle contient des données nom prenom qui ne devrait pas être accessible à certaines personnes qui utiliseront l'application et c'est fastidieux de faire un update pour chaque ligne,je cherche donc une methode pour remplacer les noms et prénoms par des données fictives.Merco de m'aiguiller

  2. #2
    Modérateur

    Profil pro
    dba
    Inscrit en
    Janvier 2010
    Messages
    5 643
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : dba

    Informations forums :
    Inscription : Janvier 2010
    Messages : 5 643
    Points : 13 092
    Points
    13 092
    Par défaut
    Bonjour,

    Pour pouvoir vous aiguiller, il faudrait savoir dans quelle direction vous allez...
    j'ai donc quelques questions :
    1/ voulez-vous masquer les vrais noms/prénom à certaines personnes mais pas a d'autres ?
    2/ pourquoi faire un update sur chaque ligne et pas un seul update pour toutes les lignes ?
    3/ d'ou viennent vos données fictives ?


    J'en ai donc, mais que je pourrai poser de façon plus pertinente en connaissant la réponses à celles-ci...

  3. #3
    Nouveau membre du Club
    Inscrit en
    Novembre 2007
    Messages
    68
    Détails du profil
    Informations forums :
    Inscription : Novembre 2007
    Messages : 68
    Points : 35
    Points
    35
    Par défaut
    il ne s'agit pas de masquer les données mais de les remplacer par substitution de données fictives.On a une table avec des données réelles et on souhaiteraient les remplacer par des données fictives iil ne s'agit pas de faire un update générale mais plutot dans le style faire un script qui creerait et remplacerait les noms prenoms par des nom fictifs.En outre je ne pense pas que les données proviennent d'une autre table mais si vous avez la technique elle m'interesse en plus de l'autre

  4. #4
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 770
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 770
    Points : 52 726
    Points
    52 726
    Billets dans le blog
    5
    Par défaut
    en faisant un UPDATE global en déclanat par ligne et par caractères.

    Exemple, décalage entre nom et prénom :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    SELECT T1.Nom, T2.Prenom
    FROM    Matable AS T1
               INNER JOIN MaTable AS T2
                        ON T1.Clef = (T1.Clef + 458) % (maxClef)
    Décalage du nom lui même :
    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    SUBSTRING(Nom, 4, LEN(Nom) - 3) +SUBSTRING(Nom, 1, 3)
    Etc...

    A +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  5. #5
    Modérateur

    Profil pro
    dba
    Inscrit en
    Janvier 2010
    Messages
    5 643
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : dba

    Informations forums :
    Inscription : Janvier 2010
    Messages : 5 643
    Points : 13 092
    Points
    13 092
    Par défaut
    Je ne suis toujours pas sur de bien saisir

    expliquez un peu plus le contexte, donnez un exemple, ce sera plus clair.

    il faut bien que les nom/prénoms de remplacement proviennent de quelque part !

  6. #6
    Nouveau membre du Club
    Inscrit en
    Novembre 2007
    Messages
    68
    Détails du profil
    Informations forums :
    Inscription : Novembre 2007
    Messages : 68
    Points : 35
    Points
    35
    Par défaut anonymiser les données
    .L'idee c'est de recuperer la base de production elle contient une table nommée patient et le but serait de vider cette table et de la fournir avec des patients fictifs .Dans la discussion tu me montre un exemple que je ne comprends pas très bien (que fait il).il s'agirait d'utiliser un generateur de données de fictive(en connais tu quelques un merci) qui aurait pour but de changer le nom le prenom le numero de telephone et l'adresse du patient.Il y a une chose qui est sure les données ficitives ne proviennent pas d'une autre table.Un update cela me parait peut etre peut etre je me trompes rectifie moi dans ce cas.En gros voila ce qu'il y a faire et si tu connais des generateurs de données fictives merci de m'en montrer c'est un peu la galère

  7. #7
    Membre chevronné Avatar de Jinroh77
    Homme Profil pro
    Consultant en Business Intelligence
    Inscrit en
    Février 2006
    Messages
    1 964
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : France, Seine et Marne (Île de France)

    Informations professionnelles :
    Activité : Consultant en Business Intelligence

    Informations forums :
    Inscription : Février 2006
    Messages : 1 964
    Points : 2 145
    Points
    2 145
    Par défaut
    Pour simplement générer des données fictives, venant de nul part il y a pas mal d'outils pour faire cela (powerAMC a un outil qui le permet, sinon dans les produits de Red Gate il y en a 1 très bon pour générer des données).

    Par contre, générer des données pour une seule table implique que celle-ci reste en cohérence avec le reste de la base.

    On ne sait pas comment fonctionne cette table, de quelle manière elle est liée au autres etc. Il n'est donc pas possible de la vider pour la re-remplir avec d'autres données. les jointures ne fonctionneraient alors probablement plus.

    Ce que propose SQL Pro est de modifier les valeurs de la table via un UPDATE (mise à jour) on ne touche alors pas au colonne permettant de faire des jointures, les clefs, mais simplement aux descriptifs de nom, prénom, tél. etc.
    Alexandre Chemla - Consultant MS BI chez Masao

  8. #8
    Nouveau membre du Club
    Inscrit en
    Novembre 2007
    Messages
    68
    Détails du profil
    Informations forums :
    Inscription : Novembre 2007
    Messages : 68
    Points : 35
    Points
    35
    Par défaut anonymiser les données
    comment pourrai je faire un update pour modifier les nom et prenoms de chaque ligne de la table sans avoir a en faire un par ligne tout en sachant que chaque ligne doit avoir un nom et prenom differents?

  9. #9
    Modérateur

    Profil pro
    dba
    Inscrit en
    Janvier 2010
    Messages
    5 643
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : dba

    Informations forums :
    Inscription : Janvier 2010
    Messages : 5 643
    Points : 13 092
    Points
    13 092
    Par défaut
    Soit en appliquant ce que SQLPro vous a indiqué :
    Cela "mélangera" les prénoms, et pour les noms, cela les rendra difficilement identifiables, car le debut de chaque nom se retrouvera à la fin :
    'Martin' deviendra 'tinmar', 'dupond' deviendra 'onddup',...

    bien sur 'Poe' restera 'Poe' et si vous avez des noms de moins de 3 lettres, vous aurez une erreur...

    Si cette solution ne vous convient pas, vous avez d'autres solutions, mais il faudrait connaitre plus précisément votre besoin. Comme par exemple, voulez vous qu'à la fin cela ressemble à quelque chose de vraisemblable, ou est-ce juste pour des tests ? dans ce cas, vous pourriez facilement, en une seule requête, remplacer vos noms par :
    - nom1
    - nom2
    - nom3
    -...

    Si votre seule contrainte est l'unicité des noms, cela suffira !

    Si vous voulez que vos noms ressemblent encore a des noms vraisemblables, vous pouvez aussi vous procurer une liste de contacts (base de données de prospection par exemple, mais attention aux droits dans ce cas) et remplacer vos noms par les noms de cette base, toujours en une simple requête...

    tout dépend de ce que vous voulez obtenir au final (est-ce pour présenter à des clients, pour faire des tests,... ?)

  10. #10
    Membre chevronné

    Homme Profil pro
    Administrateur de base de données
    Inscrit en
    Août 2007
    Messages
    1 216
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 40
    Localisation : Suisse

    Informations professionnelles :
    Activité : Administrateur de base de données
    Secteur : Industrie Pharmaceutique

    Informations forums :
    Inscription : Août 2007
    Messages : 1 216
    Points : 1 758
    Points
    1 758
    Par défaut
    Je dirais que pour chaque lettre de chaque champs (nom, prenom), la remplacer en ajoutant a son code ascii une valeur aleatoire entre 2 et 20.
    Faisant cela, personne ne sait exactement qui sont les personnes (pas de reverse thinking possible).
    Par contre vos noms et prenoms ne ressembleront plus a rien - mais je pense pas que se soit un soucis ici, si ?

  11. #11
    Nouveau membre du Club
    Inscrit en
    Novembre 2007
    Messages
    68
    Détails du profil
    Informations forums :
    Inscription : Novembre 2007
    Messages : 68
    Points : 35
    Points
    35
    Par défaut anonymiser les données
    il s'agit de presenter l'application à des clients donc il faudrait que les noms ressemble à quelque chose comment faire?

  12. #12
    Modérateur

    Profil pro
    dba
    Inscrit en
    Janvier 2010
    Messages
    5 643
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : dba

    Informations forums :
    Inscription : Janvier 2010
    Messages : 5 643
    Points : 13 092
    Points
    13 092
    Par défaut
    Et "mélanger" également les noms ne suffirait pas ?

    les noms resteraient les vrais noms, mais rattachés au dossier d'un autre patient...

    combien as-tu de lignes dans la table patient ?

    Car si tu veux des noms qui ressemblent à des noms, il n'y a pas de solution miracle, il faudra bien que les "nouveaux" noms sortent de quelque part !

  13. #13
    Nouveau membre du Club
    Inscrit en
    Novembre 2007
    Messages
    68
    Détails du profil
    Informations forums :
    Inscription : Novembre 2007
    Messages : 68
    Points : 35
    Points
    35
    Par défaut anonymiser les données
    ok mais techniquement comment melanger les noms la table contient 106177 lignes il faut savoir qu'il faut modifier l'adresse et le telephone aussi comment faire

  14. #14
    Modérateur

    Profil pro
    dba
    Inscrit en
    Janvier 2010
    Messages
    5 643
    Détails du profil
    Informations personnelles :
    Localisation : France, Rhône (Rhône Alpes)

    Informations professionnelles :
    Activité : dba

    Informations forums :
    Inscription : Janvier 2010
    Messages : 5 643
    Points : 13 092
    Points
    13 092
    Par défaut
    à partir de la solution de SQLPro :

    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
     
    UPDATE patient
    SET Nom = P2.Nom
    FROM  Patient P2
    WHERE P2.Clef = (Patient.Clef + 458) % (maxClef)

    En remplaçant "Clef" par le colonne de la clef primaire de votre table...


    pour "melanger" les autre colonnes (prenom, telephone,...) faites de même (en changeant à chaque fois la valeur 458 par autre chose au hasard)

  15. #15
    Nouveau membre du Club
    Inscrit en
    Novembre 2007
    Messages
    68
    Détails du profil
    Informations forums :
    Inscription : Novembre 2007
    Messages : 68
    Points : 35
    Points
    35
    Par défaut ca marche
    ca marche merci

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Réponses: 1
    Dernier message: 30/05/2013, 22h25
  2. Exporter & anonymiser des données
    Par CPI_en_mousse dans le forum Langage SQL
    Réponses: 21
    Dernier message: 08/12/2011, 13h50
  3. Réponses: 13
    Dernier message: 20/03/2003, 08h11
  4. Structure des données en retour d'un DBExtract ?
    Par mikouts dans le forum XMLRAD
    Réponses: 4
    Dernier message: 24/01/2003, 15h15
  5. Réponses: 2
    Dernier message: 18/12/2002, 10h30

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo