Précédent   Forum des professionnels en informatique > Bases de données > MySQL
MySQL Forum d'entraide MySQL. Avant de poster -> FAQ MySQL, Tutoriels MySQL
Partagez cette discussion sur d'autres réseaux sociaux : Viadeo Twitter Google Facebook Digg Delicious MySpace Yahoo
Réponse Proposer ce sujet en actualité
 
Outils de la discussion
Publicité
'
Vieux 30/06/2011, 19h25   #1
Membre du Club
 
Avatar de PIEPLU
 
Inscription : avril 2003
Messages : 299
Détails du profil
Informations personnelles :
Âge : 30

Informations forums :
Inscription : avril 2003
Messages : 299
Points : 40
Points : 40
Envoyer un message via MSN à PIEPLU Envoyer un message via Skype™ à PIEPLU
Par défaut Nettoyage de base de données MySQL

Bonsoir tout le monde,

J'ai une grosse table "Table1" avec près d'1 millions de données. Le problème, c'est que j'ai des doublons.
Mes doublons, je les retrouve avec le champs telephone si au moins deux numéros sont identiques.

Ma question, c'est comment faire rapidement pour analyser cette table ?

Merci
__________________
Vincent Pieplu
Développeur Site Internet
PIEPLU est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 30/06/2011, 20h06   #2
Membre Expert
 
Homme Eric Dureuil
Développeur informatique
Inscription : avril 2011
Messages : 853
Détails du profil
Informations personnelles :
Nom : Homme Eric Dureuil
Localisation : France, Isère (Rhône Alpes)

Informations professionnelles :
Activité : Développeur informatique
Secteur : High Tech - Multimédia et Internet

Informations forums :
Inscription : avril 2011
Messages : 853
Points : 1 332
Points : 1 332
salut on peut avoir la structure?
__________________
Eric Dureuil, développeur web, c/c++, java indépendant
soyons
pensez à mettre et
ericd69 est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 30/06/2011, 20h08   #3
Membre du Club
 
Avatar de PIEPLU
 
Inscription : avril 2003
Messages : 299
Détails du profil
Informations personnelles :
Âge : 30

Informations forums :
Inscription : avril 2003
Messages : 299
Points : 40
Points : 40
Envoyer un message via MSN à PIEPLU Envoyer un message via Skype™ à PIEPLU
id > mediumint(7) en autoincrémente
idEntreprise > int(8)
telephone > varchar(20)

Merci
__________________
Vincent Pieplu
Développeur Site Internet
PIEPLU est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 30/06/2011, 21h45   #4
Membre Expert
 
Inscription : août 2008
Messages : 1 271
Détails du profil
Informations forums :
Inscription : août 2008
Messages : 1 271
Points : 1 929
Points : 1 929
Les doublons : détection et éradication...
skuatamad est déconnecté   Envoyer un message privé Réponse avec citation 00
Vieux 30/06/2011, 21h47   #5
Membre Expert
 
Homme Eric Dureuil
Développeur informatique
Inscription : avril 2011
Messages : 853
Détails du profil
Informations personnelles :
Nom : Homme Eric Dureuil
Localisation : France, Isère (Rhône Alpes)

Informations professionnelles :
Activité : Développeur informatique
Secteur : High Tech - Multimédia et Internet

Informations forums :
Inscription : avril 2011
Messages : 853
Points : 1 332
Points : 1 332
déjà des int(4) ça fait bien l'affaire (4 milliards de combinaisons)

si tes téléphones ne sont que des numéros français (sans + ou parenthèses) et que tu ne t'en sers pas dans un logiciel de numérotation alors autant les coder en int(4) (que tu complètes par un 0 à gauche au pire quand tu les ressors pour les afficher)
là tu divises presque la taille de ta table par 3

donc je suppose qu'une entreprise peut avoir différents numéros vu ta table

l'idée: créer une table de structure identique table2 et la remplir en utilisant cette requête:
Code sql :
1
2
3
SELECT INSERT INTO table2(idEntreprise,telephone)
SELECT idEntreprise,telephone FROM table1
GROUP BY telephone;

ça devrait te supprimer les doublons de téléphone...
tu peux rajouter un order by pour éventuellement les trier mais bon ça ne devrait pas changer grand chose...
__________________
Eric Dureuil, développeur web, c/c++, java indépendant
soyons
pensez à mettre et
ericd69 est déconnecté   Envoyer un message privé Réponse avec citation 00
Réponse Proposer ce sujet en actualité
Outils de la discussion



Fuseau horaire GMT +2. Il est actuellement 03h52.


 
 
 
 
Partenaires

Hébergement Web