IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

PHP & Base de données Discussion :

[Conception] Traitement des doublons (grosse BDD)


Sujet :

PHP & Base de données

  1. #1
    Membre habitué
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    550
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 550
    Points : 193
    Points
    193
    Par défaut [Conception] Traitement des doublons (grosse BDD)
    Bonjour.

    J'aurais voulu avoir des avis.
    Ma société va acheter plusieurs liste de (clients prospects) à diverses sociétés.
    Quel serait le meilleur moyen pour essayer de lutter contre l'insertion de doublon?

    En effet un même prospect peux apparaitre plusieurs fois dans les différentes sources achetés

    Faire une verification avant l'insertion (mais comment?)
    Ou alors insérer et créer à part une page de nettoyage ou le script afficherait toutes les lignes qui ont au moins les champs nom,prenom,tel,adresse,telephone ont commun et avec une possibilité d'effacement.

    Si vous avez de meilleurs méthodes je suis preneur.
    Cordialement.

  2. #2
    Expert éminent sénior

    Avatar de Deepin
    Homme Profil pro
    Ingénieur - Chef de projet Modélisation/Simulation
    Inscrit en
    Avril 2004
    Messages
    3 164
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : Afrique Du Sud

    Informations professionnelles :
    Activité : Ingénieur - Chef de projet Modélisation/Simulation
    Secteur : Industrie

    Informations forums :
    Inscription : Avril 2004
    Messages : 3 164
    Points : 51 095
    Points
    51 095
    Par défaut
    Salut,
    la creation d'un script de nettoyage me parait etre une solution convenable.
    A++

  3. #3
    Membre régulier
    Inscrit en
    Juin 2007
    Messages
    89
    Détails du profil
    Informations personnelles :
    Âge : 43

    Informations forums :
    Inscription : Juin 2007
    Messages : 89
    Points : 99
    Points
    99
    Par défaut
    Bonjour, les deux solutions son valables.

    Si tu vérifie avant, tu ne surcharge pas la base avec des écritures et des suppressions. En plus tu évites la possibilité de créer une relation sur un doublon ( et donc si tu as une intégrité référentiel, l'impossibilité de supprimer le doublon). Par contre tu dois peut être gérer le code de vérification pour chaque source

    Si tu vérifie après, cela permet d'utiliser la même fonction pour chaque source ajouté (code plus simple). Tu réutiliser aussi la fonction pour les insertions manuelles ou les modifications.
    Par contre, tu fais plus travailler la base de données, et le risque de relations avec les doublon est plus élevé, donc tu dois gérer toi même la réaffections des relations.

    Pour conclure, cela dépends de la forme de tes sources , de la forme de ta base de données, et de la façon d'identifier tes clients (quels champs, case sensitive ou pas, ...)

  4. #4
    Membre expérimenté

    Profil pro
    Inscrit en
    Octobre 2002
    Messages
    1 138
    Détails du profil
    Informations personnelles :
    Âge : 44
    Localisation : France, Rhône (Rhône Alpes)

    Informations forums :
    Inscription : Octobre 2002
    Messages : 1 138
    Points : 1 504
    Points
    1 504
    Par défaut
    Moi j'avoue que je prefererai la solution ou tu nettoies avant via un script fait sur mesure pour celà. Pourquoi? Simplement parce qu'une fois le script fonctionnel, tu le lances une fois et tout est propre après pour travailler dessus comme tu le veux.
    En fait, cela depend aussi du format de tes listes.
    Imaginons que les listes soient en excel et qu'elles aient toutes les memes champs.
    Tu les transformes en csv dans un premier temps.
    Ensuite tu crées un script qui va charger ligne par ligne tes prospects. A chaque ligne tu vérifies que tu n'as pas deja inséré le prospect (en testant nom, prenom, email , etc...).Si le prospect existe deja, tu passes à la ligne suivante. Sinon tu l'inseres dans la bdd et tu moulines jusqu'a ce que mort ou réussite s'en suivent

  5. #5
    Membre averti Avatar de max44410
    Étudiant
    Inscrit en
    Juin 2003
    Messages
    426
    Détails du profil
    Informations personnelles :
    Âge : 41

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Juin 2003
    Messages : 426
    Points : 301
    Points
    301
    Par défaut
    Salut,

    Moi je suis plus de l'avis de "dewsz", faire une fonction qui test avant d'ajouter pour eviter d'avoir des contraintes d'integritées à gérer par la suite. C'est beaucoup moins complexe a mettre en place et en plus tu peux t'en resservir par la suite a chaque fois que tu ajoutes quelques chose dans la base de données.

    Voila, bonne continuation

  6. #6
    Membre habitué
    Profil pro
    Inscrit en
    Septembre 2004
    Messages
    550
    Détails du profil
    Informations personnelles :
    Localisation : France

    Informations forums :
    Inscription : Septembre 2004
    Messages : 550
    Points : 193
    Points
    193
    Par défaut
    Merci à vous pour ces précieuses informations.

+ Répondre à la discussion
Cette discussion est résolue.

Discussions similaires

  1. Traitement des doublons
    Par astrolane dans le forum Langage
    Réponses: 5
    Dernier message: 06/09/2007, 19h38
  2. [Debutant] Conception du traitement des données
    Par badack dans le forum JDBC
    Réponses: 6
    Dernier message: 04/01/2007, 16h13
  3. [Conception] Supprimer des lignes doublons.
    Par elkion dans le forum PHP & Base de données
    Réponses: 1
    Dernier message: 07/12/2006, 19h04
  4. [Conception] Optimisation des traitements de variable
    Par nebil dans le forum PHP & Base de données
    Réponses: 43
    Dernier message: 18/08/2006, 22h22
  5. Traitement des Doublons
    Par dert72 dans le forum Langage SQL
    Réponses: 2
    Dernier message: 19/06/2006, 10h46

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo