Bonjour,
J'ai une table d'environ 2 millions de lignes (avec 12 colonnes) et j'ai besoin, en 'one shot' par mois éliminer les doublons pour ces critères:
on a un identifiant client (num_clt) et un date de commande (date_cmd)
en gros il me faut éliminer les plus anciens pour chaque client.
2 Choses:
=> Ma requete ne passe pas car excède les 30 secondes de traitement (je ne peux pas modifier ça)
=> Ma requete que je pensais la plus simple possible n'est peu etre pas la plus facile à traiter pour mysql:
(ici c'est juste la requete de selection qui ne passe quand meme pas):
SELECT sub.*(SELECT * FROM bigtable ORDER BY date_cmd) sub GROUP BY num_clt
Si je fait un ORDER suivi d'un GROUP BY ça ne fera pas ce que je veux je pense et ça n'as pas l'air d'aller plus vite non plus.
J'ai mis un index sur num_clt ça aide un brin, mais pas des masses.
Des idées pour couper ce traitement en petis bouts ?
Pour que la requete tourne mieux ?
Partager