IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Décisions SGBD Discussion :

[Postgresql] insertion sans doublon


Sujet :

Décisions SGBD

  1. #1
    Membre du Club
    Profil pro
    Inscrit en
    Avril 2005
    Messages
    76
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2005
    Messages : 76
    Points : 53
    Points
    53
    Par défaut [Postgresql] insertion sans doublon
    Bonjour,

    je suis plutôt novice en matière d'administration de base de données.
    J'ai fait un script java (J2EE) d'insertion de données dans une table qui peut contenir plus d'un million de lignes. Le fichier source à l'insertion peut contenir facilement 200k lignes.

    Les données sont caractérisées ainsi: pour chaque jour de l'année, pour une région donnée, j'ai une série de chiffres...
    Une année représente donc un certain nb de lignes: 365 jours * 468 régions.

    Les régions sont en fait un int4, la date du type AAAAMMJJ est un int4 aussi.

    Quel serait la solution la moins couteuse en ressources pour vérifier à chaque insertion que les données ne sont pas déjà présentes dans la base ?

    Un index sur le N° de région, un autre sur la date.
    Et je fait à chaque insertion je fait une requete "test" sur le couple (N° région, Date) ?

  2. #2
    Expert éminent sénior
    Avatar de orafrance
    Profil pro
    Inscrit en
    Janvier 2004
    Messages
    15 967
    Détails du profil
    Informations personnelles :
    Âge : 46
    Localisation : France

    Informations forums :
    Inscription : Janvier 2004
    Messages : 15 967
    Points : 19 073
    Points
    19 073
    Par défaut
    http://sqlpro.developpez.com/cours/doublons/

    N'y a-t-il pas d'indexes unique ?

    Sinon, le forum PostgreSQL ne serait-il pas plus adapté ?

  3. #3
    Rédacteur

    Avatar de SQLpro
    Homme Profil pro
    Expert bases de données / SQL / MS SQL Server / Postgresql
    Inscrit en
    Mai 2002
    Messages
    21 774
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Var (Provence Alpes Côte d'Azur)

    Informations professionnelles :
    Activité : Expert bases de données / SQL / MS SQL Server / Postgresql
    Secteur : Conseil

    Informations forums :
    Inscription : Mai 2002
    Messages : 21 774
    Points : 52 746
    Points
    52 746
    Billets dans le blog
    5
    Par défaut
    Un seul index non cluster bicolonne dans le sens du test.

    Exemple si la requête de recherche est :
    SELECT *
    FROM MaTable
    WHERE LaDate = ... AND LaRegion = ...

    Alors l'index doit être composé de Ladate, LaRégion.

    a +
    Frédéric Brouard - SQLpro - ARCHITECTE DE DONNÉES - expert SGBDR et langage SQL
    Le site sur les SGBD relationnels et le langage SQL: http://sqlpro.developpez.com/
    Blog SQL, SQL Server, SGBDR : http://blog.developpez.com/sqlpro
    Expert Microsoft SQL Server - M.V.P. (Most valuable Professional) MS Corp.
    Entreprise SQL SPOT : modélisation, conseils, audit, optimisation, formation...
    * * * * * Expertise SQL Server : http://mssqlserver.fr/ * * * * *

  4. #4
    Membre du Club
    Profil pro
    Inscrit en
    Avril 2005
    Messages
    76
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Avril 2005
    Messages : 76
    Points : 53
    Points
    53
    Par défaut
    Désolé si je n'ai pas posté dans la bonne sous catégorie. Je sais pas si c'est vraiment lié à postgres.

    J'ai une cle auto incrémentable a partir d'une sequence.
    J'ai lu entre temps la page tuto sur les doublons.
    Donc je souhaite éviter les doublons relatifs.

    Si j'ai bien compris, un seul index sur le couple date/région.
    Je fait ma requête de recherche du même style.
    Et si je trouve une ligne je n'insère pas.

    Je vais me renseigner sur les index car je ne vois pas ce qu'est un index non cluster bicolonne...

    Edit: à priori c'est ok et plutôt simple !

    Merci à vous deux.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Optimisation d'un INSERT sans doublon
    Par rg77140 dans le forum Optimisations
    Réponses: 3
    Dernier message: 03/04/2013, 12h21
  2. insertion image avec macro sans doublon lors de la réexécution
    Par picogunsy dans le forum Macros et VBA Excel
    Réponses: 7
    Dernier message: 08/07/2010, 15h24
  3. Liste chainée triée sans insertion de doublon
    Par Bogs dans le forum Débuter
    Réponses: 1
    Dernier message: 22/03/2009, 18h50
  4. Insertion sans doublons
    Par franculo_caoulene dans le forum Développement
    Réponses: 2
    Dernier message: 16/09/2008, 09h59
  5. [Conception] Insertion de données sans doublon
    Par Yukhaa dans le forum PHP & Base de données
    Réponses: 5
    Dernier message: 19/10/2006, 08h35

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo