Précédent   Forum des professionnels en informatique > Bases de données > Décisions SGBD
Décisions SGBD Forum de décisions sur le choix en bases de données. Le Comparatif
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 10/07/2003, 17h47   #1
Membre à l'essai
 
Inscription : mars 2002
Messages : 76
Détails du profil
Informations forums :
Inscription : mars 2002
Messages : 76
Points : 22
Points : 22
Envoyer un message via AIM à maxvador
Par défaut [resolu][algo]Dédoublonnement

Salut à tous,

Le probleme est assez simple. j'ai une base de donnée sur un site web où on peut s'inscrire pour avoir des infos, accès au forum etc.....

Il y a beaucoup d'enregistrement, environ 100 000. Le probleme c qu'il y a pas mal de doublon ( à cause d'oubli de mot de passe etc).

Mon objectif est donc de la dédoublonner.

Où est ce que je peux trouver un algo qui ferait ca?
__________________
Tout probleme a une solution.
maxvador est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/07/2003, 18h37   #2
Membre actif
 
Avatar de Rmotte
 
Inscription : octobre 2002
Messages : 234
Détails du profil
Informations forums :
Inscription : octobre 2002
Messages : 234
Points : 152
Points : 152
salut,

pourquoi tu le fais pas toi meme, si il y a une date d'enregistrement, tu recherche la plus récente et tu supprime les autres, sinon, tu peut créer un tableau (c pas forcément la meilleure méthode, mais bon...) avec tes login et les compter, si certains sont "surchargés", tu trouve un truc pour différencier les bons des obsoletes...

c quoi comme SGBD, et surtout, c quoi comme langage?
__________________
Le libre arbitre de l'homme consiste à choisir la femme qui prendra la décision à sa place
la doc php / la FAQ PHP
Rmotte est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 10/07/2003, 23h10   #3
Membre à l'essai
 
Inscription : mars 2002
Messages : 76
Détails du profil
Informations forums :
Inscription : mars 2002
Messages : 76
Points : 22
Points : 22
Envoyer un message via AIM à maxvador
le SGBD (sql server) n'est pas un probleme car la base va etre refaite, dans un autre sgbd non determiné pr l'instant (certainement SQL server).

Pour ce qui est du langage, ca n'a pas d'importance car l'appli que je vais faire va etre juste faite afin de passer de la base A à la base B.

Je pensais faire une recherche sur les noms et prénoms et adresse.
__________________
Tout probleme a une solution.
maxvador est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/07/2003, 00h31   #4
Membre habitué
 
Inscription : mai 2003
Messages : 145
Détails du profil
Informations forums :
Inscription : mai 2003
Messages : 145
Points : 146
Points : 146
---------------

édité par sinarf
---------------

tu comptes le nombre de ligne strictement identiques

Code :
1
2
3
SELECT count (*),*
FROM ta_table
GROUP BY tesnoms
en résultat tu débusques tes doublons, ce qui possde une valeur > à 1 sont des doublons.
par contre pour les supprimer tu dois passer par une table temporaire de même structure que la table qui contient les doublons, ensuite tu copies les dounlones en une seule version dans la table temp puis tu supprimes les doublons puis tu réinseres les doublons contenus dans la table temporaire au seind ela table originale puis tu sup^primes la table originale, le tour est joué!
wello00 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/07/2003, 01h12   #5
Rédacteur
 
Avatar de sinarf
 
Michel Blavin
Inscription : octobre 2002
Messages : 210
Détails du profil
Informations personnelles :
Nom : Michel Blavin
Localisation : France, Loire Atlantique (Pays de la Loire)

Informations forums :
Inscription : octobre 2002
Messages : 210
Points : 349
Points : 349
Comme tu dis ton problème est assez simple, eviter les doublons c'est le B A BA des bases de donnees.

Le plus simple c'est de configurer correctement ta nouvelle base pour qu'elle refuse les doublons. Sous Access on metrait un index multi-champs unique dans la table concernée et zou on importe les données les doublons seront tous simplement rejetés et en plus tu ne pourra plus avoir de doublons dans ta nouvelle base.
Je ne connais pas SQL Server mais cela m'etonnerai qu'il n'y ait pas un processus similaire
sinarf est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 11/07/2003, 10h01   #6
Membre à l'essai
 
Inscription : mars 2002
Messages : 76
Détails du profil
Informations forums :
Inscription : mars 2002
Messages : 76
Points : 22
Points : 22
Envoyer un message via AIM à maxvador
La solution de sinarf me parait la plus simple, sous ms sql server c tres certainement faisable.

Merci
__________________
Tout probleme a une solution.
maxvador est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité Cette discussion est résolue.
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 11h12.


 
 
 
 
Partenaires

Hébergement Web