Précédent   Forum des professionnels en informatique > Bases de données > MS SQL-Server
MS SQL-Server Forum Microsoft SQL-Server. Avant de poster -> FAQ SQL-Server, Tutoriels SQL-Server
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 07/03/2011, 16h11   #1
Invité de passage
 
Inscription : novembre 2007
Messages : 68
Détails du profil
Informations forums :
Inscription : novembre 2007
Messages : 68
Points : 4
Points : 4
Par défaut anonymiser des données

bonjour j'ai un petit souci technique,je cherche à anonymiser les données d'une table de ma base de données en l'occurence elle contient des données nom prenom qui ne devrait pas être accessible à certaines personnes qui utiliseront l'application et c'est fastidieux de faire un update pour chaque ligne,je cherche donc une methode pour remplacer les noms et prénoms par des données fictives.Merco de m'aiguiller
flex@ est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 07/03/2011, 16h36   #2
Membre Expert
 
Inscription : janvier 2010
Messages : 1 084
Détails du profil
Informations personnelles :
Localisation : France, Rhône (Rhône Alpes)

Informations forums :
Inscription : janvier 2010
Messages : 1 084
Points : 1 573
Points : 1 573
Bonjour,

Pour pouvoir vous aiguiller, il faudrait savoir dans quelle direction vous allez...
j'ai donc quelques questions :
1/ voulez-vous masquer les vrais noms/prénom à certaines personnes mais pas a d'autres ?
2/ pourquoi faire un update sur chaque ligne et pas un seul update pour toutes les lignes ?
3/ d'ou viennent vos données fictives ?


J'en ai donc, mais que je pourrai poser de façon plus pertinente en connaissant la réponses à celles-ci...
aieeeuuuuu est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 07/03/2011, 16h49   #3
Invité de passage
 
Inscription : novembre 2007
Messages : 68
Détails du profil
Informations forums :
Inscription : novembre 2007
Messages : 68
Points : 4
Points : 4
il ne s'agit pas de masquer les données mais de les remplacer par substitution de données fictives.On a une table avec des données réelles et on souhaiteraient les remplacer par des données fictives iil ne s'agit pas de faire un update générale mais plutot dans le style faire un script qui creerait et remplacerait les noms prenoms par des nom fictifs.En outre je ne pense pas que les données proviennent d'une autre table mais si vous avez la technique elle m'interesse en plus de l'autre
flex@ est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 07/03/2011, 16h54   #4
Rédacteur/Modérateur

 
Avatar de SQLpro
 
Homme Frédéric BROUARD
Expert SGBDR & SQL
Inscription : mai 2002
Messages : 10 950
Détails du profil
Informations personnelles :
Nom : Homme Frédéric BROUARD
Localisation : France

Informations professionnelles :
Activité : Expert SGBDR & SQL
Secteur : Conseil

Informations forums :
Inscription : mai 2002
Messages : 10 950
Points : 17 769
Points : 17 769
en faisant un UPDATE global en déclanat par ligne et par caractères.

Exemple, décalage entre nom et prénom :
Code :
1
2
3
4
SELECT T1.Nom, T2.Prenom
FROM    Matable AS T1
           INNER JOIN MaTable AS T2
                    ON T1.Clef = (T1.Clef + 458) % (maxClef)
Décalage du nom lui même :
Code :
SUBSTRING(Nom, 4, LEN(Nom) - 3) +SUBSTRING(Nom, 1, 3)
Etc...

A +
__________________
Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
Site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
Blog SQL, SQL Server, modélisation données : http://blog.developpez.com/sqlpro
http://www.sqlspot.com : modélisation, conseils, audit, optimisation, formation
* * * * * Enseignant CNAM PACA - ISEN Toulon - CESI Aix en Provence * * * * *
SQLpro est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 07/03/2011, 16h56   #5
Membre Expert
 
Inscription : janvier 2010
Messages : 1 084
Détails du profil
Informations personnelles :
Localisation : France, Rhône (Rhône Alpes)

Informations forums :
Inscription : janvier 2010
Messages : 1 084
Points : 1 573
Points : 1 573
Je ne suis toujours pas sur de bien saisir

expliquez un peu plus le contexte, donnez un exemple, ce sera plus clair.

il faut bien que les nom/prénoms de remplacement proviennent de quelque part !
aieeeuuuuu est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 07/03/2011, 17h17   #6
Invité de passage
 
Inscription : novembre 2007
Messages : 68
Détails du profil
Informations forums :
Inscription : novembre 2007
Messages : 68
Points : 4
Points : 4
Par défaut anonymiser les données

.L'idee c'est de recuperer la base de production elle contient une table nommée patient et le but serait de vider cette table et de la fournir avec des patients fictifs .Dans la discussion tu me montre un exemple que je ne comprends pas très bien (que fait il).il s'agirait d'utiliser un generateur de données de fictive(en connais tu quelques un merci) qui aurait pour but de changer le nom le prenom le numero de telephone et l'adresse du patient.Il y a une chose qui est sure les données ficitives ne proviennent pas d'une autre table.Un update cela me parait peut etre peut etre je me trompes rectifie moi dans ce cas.En gros voila ce qu'il y a faire et si tu connais des generateurs de données fictives merci de m'en montrer c'est un peu la galère
flex@ est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 07/03/2011, 17h44   #7
Modérateur
 
Avatar de Jinroh77
 
Homme Alexandre Chemla
Consultant en Business Intelligence
Inscription : février 2006
Messages : 1 773
Détails du profil
Informations personnelles :
Nom : Homme Alexandre Chemla
Âge : 28
Localisation : France, Seine et Marne (Île de France)

Informations professionnelles :
Activité : Consultant en Business Intelligence

Informations forums :
Inscription : février 2006
Messages : 1 773
Points : 1 837
Points : 1 837
Pour simplement générer des données fictives, venant de nul part il y a pas mal d'outils pour faire cela (powerAMC a un outil qui le permet, sinon dans les produits de Red Gate il y en a 1 très bon pour générer des données).

Par contre, générer des données pour une seule table implique que celle-ci reste en cohérence avec le reste de la base.

On ne sait pas comment fonctionne cette table, de quelle manière elle est liée au autres etc. Il n'est donc pas possible de la vider pour la re-remplir avec d'autres données. les jointures ne fonctionneraient alors probablement plus.

Ce que propose SQL Pro est de modifier les valeurs de la table via un UPDATE (mise à jour) on ne touche alors pas au colonne permettant de faire des jointures, les clefs, mais simplement aux descriptifs de nom, prénom, tél. etc.
Jinroh77 est actuellement connecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/03/2011, 11h33   #8
Invité de passage
 
Inscription : novembre 2007
Messages : 68
Détails du profil
Informations forums :
Inscription : novembre 2007
Messages : 68
Points : 4
Points : 4
Par défaut anonymiser les données

comment pourrai je faire un update pour modifier les nom et prenoms de chaque ligne de la table sans avoir a en faire un par ligne tout en sachant que chaque ligne doit avoir un nom et prenom differents?
flex@ est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/03/2011, 11h53   #9
Membre Expert
 
Inscription : janvier 2010
Messages : 1 084
Détails du profil
Informations personnelles :
Localisation : France, Rhône (Rhône Alpes)

Informations forums :
Inscription : janvier 2010
Messages : 1 084
Points : 1 573
Points : 1 573
Soit en appliquant ce que SQLPro vous a indiqué :
Cela "mélangera" les prénoms, et pour les noms, cela les rendra difficilement identifiables, car le debut de chaque nom se retrouvera à la fin :
'Martin' deviendra 'tinmar', 'dupond' deviendra 'onddup',...

bien sur 'Poe' restera 'Poe' et si vous avez des noms de moins de 3 lettres, vous aurez une erreur...

Si cette solution ne vous convient pas, vous avez d'autres solutions, mais il faudrait connaitre plus précisément votre besoin. Comme par exemple, voulez vous qu'à la fin cela ressemble à quelque chose de vraisemblable, ou est-ce juste pour des tests ? dans ce cas, vous pourriez facilement, en une seule requête, remplacer vos noms par :
- nom1
- nom2
- nom3
-...

Si votre seule contrainte est l'unicité des noms, cela suffira !

Si vous voulez que vos noms ressemblent encore a des noms vraisemblables, vous pouvez aussi vous procurer une liste de contacts (base de données de prospection par exemple, mais attention aux droits dans ce cas) et remplacer vos noms par les noms de cette base, toujours en une simple requête...

tout dépend de ce que vous voulez obtenir au final (est-ce pour présenter à des clients, pour faire des tests,... ?)
aieeeuuuuu est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/03/2011, 12h00   #10
Modérateur
 
Homme
Administrateur de base de données
Inscription : août 2007
Messages : 1 158
Détails du profil
Informations personnelles :
Sexe : Homme
Âge : 28
Localisation : Belgique

Informations professionnelles :
Activité : Administrateur de base de données
Secteur : Industrie Pharmaceutique

Informations forums :
Inscription : août 2007
Messages : 1 158
Points : 1 617
Points : 1 617
Je dirais que pour chaque lettre de chaque champs (nom, prenom), la remplacer en ajoutant a son code ascii une valeur aleatoire entre 2 et 20.
Faisant cela, personne ne sait exactement qui sont les personnes (pas de reverse thinking possible).
Par contre vos noms et prenoms ne ressembleront plus a rien - mais je pense pas que se soit un soucis ici, si ?
Ptit_Dje est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/03/2011, 12h26   #11
Invité de passage
 
Inscription : novembre 2007
Messages : 68
Détails du profil
Informations forums :
Inscription : novembre 2007
Messages : 68
Points : 4
Points : 4
Par défaut anonymiser les données

il s'agit de presenter l'application à des clients donc il faudrait que les noms ressemble à quelque chose comment faire?
flex@ est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/03/2011, 12h30   #12
Membre Expert
 
Inscription : janvier 2010
Messages : 1 084
Détails du profil
Informations personnelles :
Localisation : France, Rhône (Rhône Alpes)

Informations forums :
Inscription : janvier 2010
Messages : 1 084
Points : 1 573
Points : 1 573
Et "mélanger" également les noms ne suffirait pas ?

les noms resteraient les vrais noms, mais rattachés au dossier d'un autre patient...

combien as-tu de lignes dans la table patient ?

Car si tu veux des noms qui ressemblent à des noms, il n'y a pas de solution miracle, il faudra bien que les "nouveaux" noms sortent de quelque part !
aieeeuuuuu est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/03/2011, 14h17   #13
Invité de passage
 
Inscription : novembre 2007
Messages : 68
Détails du profil
Informations forums :
Inscription : novembre 2007
Messages : 68
Points : 4
Points : 4
Par défaut anonymiser les données

ok mais techniquement comment melanger les noms la table contient 106177 lignes il faut savoir qu'il faut modifier l'adresse et le telephone aussi comment faire
flex@ est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 08/03/2011, 14h34   #14
Membre Expert
 
Inscription : janvier 2010
Messages : 1 084
Détails du profil
Informations personnelles :
Localisation : France, Rhône (Rhône Alpes)

Informations forums :
Inscription : janvier 2010
Messages : 1 084
Points : 1 573
Points : 1 573
à partir de la solution de SQLPro :

Code SQL :
1
2
3
4
5
 
UPDATE patient
SET Nom = P2.Nom
FROM  Patient P2
WHERE P2.Clef = (Patient.Clef + 458) % (maxClef)

En remplaçant "Clef" par le colonne de la clef primaire de votre table...


pour "melanger" les autre colonnes (prenom, telephone,...) faites de même (en changeant à chaque fois la valeur 458 par autre chose au hasard)
aieeeuuuuu est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 09/03/2011, 17h10   #15
Invité de passage
 
Inscription : novembre 2007
Messages : 68
Détails du profil
Informations forums :
Inscription : novembre 2007
Messages : 68
Points : 4
Points : 4
Par défaut ca marche

ca marche merci
flex@ est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 16h05.


 
 
 
 
Partenaires

Hébergement Web