IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage SQL Discussion :

[Hive] left join - conserver un seul match


Sujet :

Langage SQL

  1. #1
    Membre du Club
    Inscrit en
    Juillet 2008
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2008
    Messages : 51
    Points : 42
    Points
    42
    Par défaut [Hive] left join - conserver un seul match
    Bonjour,

    Je dois adapter un traitement HQL existant (donc je ne peux pas tout refaire) pour

    Je souhaite conserver telle quelle ma table A et ajouter un champ qui sera valorisé par une valeur "en dur" si le critère de jointure avec ma table B est rempli au moins une fois.

    Ma table A contient (parmi des dizaines d'autres champs) :
    nom
    prenom
    date_saisie

    Ma table B est un référentiel composé de :
    nom
    prenom
    date_reelle

    Le critère de jointure est le suivant : a.nom=b.nom AND a.prenom=b.prenom AND [b.date_reelle - 7 jours <= a.date_saisie <= b.date_reelle + 7 jours]
    On est d'accord que c'est pourri et pas optimisé du tout mais je n'ai pas le choix, le traitement doit prendre en compte les écarts de saisie de la date à +/- 7 jours. Et il n'y a pas d'autre champ permettant de faire le lien.

    Le problème est qu'avec de tels critères une ligne de A peut matcher avec plusieurs ligne de B, or je veux seulement savoir si ça matche au moins une fois et si c'est le cas mettre "x" dans une nouvelle colonne en sortie de la requête (colonne qui restera vide pour les lignes où ça n'a pas matché).


    En résumé je cherche donc comment faire un left join qui ne rajoute pas de ligne dans la table de gauche lorsqu'il y a plusieurs match avec la table de droite.

    Merci d'avance pour votre aide.

  2. #2
    Expert éminent sénior
    Homme Profil pro
    Responsable Données
    Inscrit en
    Janvier 2009
    Messages
    5 198
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Responsable Données

    Informations forums :
    Inscription : Janvier 2009
    Messages : 5 198
    Points : 12 774
    Points
    12 774
    Par défaut
    Bonjour,

    Je ne connais pas HQL, mais en SQL un simple DISTINCT ferait l'affaire.

    Tatayo.

  3. #3
    Membre du Club
    Inscrit en
    Juillet 2008
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2008
    Messages : 51
    Points : 42
    Points
    42
    Par défaut
    A quel niveau le distinct ?

    Sur l'ensemble des champs du résultat de la jointure ?

  4. #4
    Expert éminent sénior
    Homme Profil pro
    Responsable Données
    Inscrit en
    Janvier 2009
    Messages
    5 198
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 50
    Localisation : France, Hérault (Languedoc Roussillon)

    Informations professionnelles :
    Activité : Responsable Données

    Informations forums :
    Inscription : Janvier 2009
    Messages : 5 198
    Points : 12 774
    Points
    12 774
    Par défaut
    Oui, sur l'ensemble du résultat de la requête.

    Tatayo.

  5. #5
    Membre du Club
    Inscrit en
    Juillet 2008
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2008
    Messages : 51
    Points : 42
    Points
    42
    Par défaut
    J'ai simplifié mon explication. En réalité j'ai environ 125 champs en sortie de la requête. Un distinct sur autant de champs ça donne quoi niveau perf ?

  6. #6
    Modérateur
    Avatar de escartefigue
    Homme Profil pro
    bourreau
    Inscrit en
    Mars 2010
    Messages
    10 133
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : bourreau
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2010
    Messages : 10 133
    Points : 38 556
    Points
    38 556
    Billets dans le blog
    9
    Par défaut
    L'opérateur DISTINCT nécessite un tri, sur 125 colonnes (et non pas "champs") c'est effectivement préjudiciable aux performances
    N'avez vous pas un critère qui permette de ne sélectionner qu'une seule ligne dans la table "OUTER" via un MAX, MIN ou autre ?

  7. #7
    Modérateur
    Avatar de escartefigue
    Homme Profil pro
    bourreau
    Inscrit en
    Mars 2010
    Messages
    10 133
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : bourreau
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2010
    Messages : 10 133
    Points : 38 556
    Points
    38 556
    Billets dans le blog
    9
    Par défaut
    En relisant votre besoin, je vois que la solution est toute simple, un test d'existence suffit :

    Code : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    select T1_nom                                           
         , T1_prn                                           
         , T1_dte                                           
         , case when exists                                 
                    (select 1                               
                     from TABLE2                            
                     where T2_nom = T1_nom                  
                       and T2_prn = T1_prn                  
                       and date(T2_dte) - 8 days < T1_dte   
                       and date(T2_dte) + 8 days > T1_dte)  
                then 'oui'                                  
                else 'non'                                  
           end                                              
    from TABLE1

  8. #8
    Membre du Club
    Inscrit en
    Juillet 2008
    Messages
    51
    Détails du profil
    Informations forums :
    Inscription : Juillet 2008
    Messages : 51
    Points : 42
    Points
    42
    Par défaut
    Malheureusement, tout mon problème découle du fait que EXISTS n'existe pas pour Hive.

Discussions similaires

  1. Réponses: 3
    Dernier message: 16/10/2017, 22h11
  2. un seul enregistrement retourné sur Left Join ?
    Par nicojet dans le forum Requêtes
    Réponses: 2
    Dernier message: 19/12/2012, 21h04
  3. Limiter un LEFT JOIN à un seul résultat
    Par bigsister dans le forum Requêtes
    Réponses: 30
    Dernier message: 12/01/2011, 14h02
  4. [HQL] Left Join fetch et exists
    Par LittleBean dans le forum Hibernate
    Réponses: 3
    Dernier message: 23/10/2009, 15h41
  5. Export d'une vue avec LEFT JOIN
    Par schnourf dans le forum MS SQL Server
    Réponses: 3
    Dernier message: 22/05/2003, 13h57

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo