IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

PostgreSQL Discussion :

Quasi Doublons sous postgresql


Sujet :

PostgreSQL

  1. #1
    Membre régulier
    Inscrit en
    Juin 2006
    Messages
    74
    Détails du profil
    Informations forums :
    Inscription : Juin 2006
    Messages : 74
    Points : 79
    Points
    79
    Par défaut Quasi Doublons sous postgresql
    Bonjour a tous,

    je possède une base Postgresql dans laquelle se trouve une table 'Contact'. Ces contacts sont rattachés à une ville. Or ces villes ont été rentrées à la main par des personnes différentes (n'écrivant pas tous de la même manière...)

    je me retrouve avec des doublons de ville (quasi-doublons) et je dois épurer ca et créer une table ville avec un indice et un libellé pour chaque villes distinctes.

    J'ai isolé les villes et le id_contact correspondant et je cherche à partir d'une requête 'Select distinct * from ville ...' isolé les villes sans les doublons.

    J'ai lu les petit papiers du sql sur le site et l'expression régulière fournie ne permet pas de sortir les quasi doublons de la forme :
    ...
    BELLEGARDE
    BELLEGARDE-SUR-VALSERINE
    BELLEGARDE-SUR VALSERINE
    BELLEGARDE SUR VALSERINE
    ...

    la table ayant environ 13000 lignes il est hors de question de traiter cela 'manuellement'. Quelqu'un aurait une idée ou une solution() a mon problème ?

  2. #2
    Candidat au Club
    Profil pro
    Inscrit en
    Novembre 2003
    Messages
    3
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Novembre 2003
    Messages : 3
    Points : 2
    Points
    2
    Par défaut
    Problème classique de qualité de données adresses.
    Approches:
    1) affecter un code (code insee commune) unique et stable.
    -à la saisie: liste de valeurs
    -en batch
    2) normaliser le libellé par liste de valeurs.

    La poste vend un fichier Hexapost de tous les codes postaux avec libellés standardisés des villes (~500€).
    Prestation commerciale pour toute l'adresse: http://www.amabis.com/service-web-rnvp.php
    Prestation commerciale pour la ville: http://www.amabis.com/service-web-rnvp.php
    Normalisation code postal/ville: http://www.amabis.com/service-web-adresse.php

  3. #3
    Membre éclairé
    Homme Profil pro
    Inscrit en
    Janvier 2006
    Messages
    476
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Corse (Corse)

    Informations forums :
    Inscription : Janvier 2006
    Messages : 476
    Points : 831
    Points
    831
    Par défaut
    bonjour,
    pour les problemes de tirets et d'espaces , une des solutions est de remplacer par exemple les tirets par des espaces
    commune=replace (commune, '-', ' ')

  4. #4
    Membre régulier
    Inscrit en
    Juin 2006
    Messages
    74
    Détails du profil
    Informations forums :
    Inscription : Juin 2006
    Messages : 74
    Points : 79
    Points
    79
    Par défaut
    merci pour vos réponses. Mon principal problème réside dans l'importation des données ^^ (l'élimination des quasi doublons, pour faire un import propre)

    Citation Envoyé par xavier-Pierre Voir le message
    bonjour,
    pour les problemes de tirets et d'espaces , une des solutions est de remplacer par exemple les tirets par des espaces
    commune=replace (commune, '-', ' ')
    je l'ai fait grâce a Notepad et ses expressions régulières

Discussions similaires

  1. 'SHOW TABLES' marche pas sous postgresql !?
    Par fet dans le forum PostgreSQL
    Réponses: 4
    Dernier message: 13/05/2004, 09h28
  2. select dans un trigger sous Postgresql
    Par kastor_grog dans le forum Requêtes
    Réponses: 1
    Dernier message: 03/09/2003, 17h00
  3. Comment entrer des lettres accentuées sous postgresql ?
    Par Chihuahua dans le forum Requêtes
    Réponses: 11
    Dernier message: 28/08/2003, 08h04
  4. Triggers sous PostGreSQL
    Par Phaf dans le forum Requêtes
    Réponses: 4
    Dernier message: 05/08/2003, 14h22
  5. Création d'utilisateur sous PostgreSQL 7.3.2 avec PHP
    Par duongkhang dans le forum PostgreSQL
    Réponses: 3
    Dernier message: 06/06/2003, 13h10

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo