IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)
Navigation

Inscrivez-vous gratuitement
pour pouvoir participer, suivre les réponses en temps réel, voter pour les messages, poser vos propres questions et recevoir la newsletter

Langage SQL Discussion :

Calculer le nombre d'occurrences par semaine d'une colonne


Sujet :

Langage SQL

Vue hybride

Message précédent Message précédent   Message suivant Message suivant
  1. #1
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2020
    Messages
    31
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 25
    Localisation : Sénégal

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2020
    Messages : 31
    Par défaut Calculer le nombre d'occurrences par semaine d'une colonne
    Bonjour
    J'ai une table SQL avec le squelette suivant :

    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    CREATE TABLE public.capge
     
    (
        artist character varying(500) COLLATE pg_catalog."default",
        album character varying(500) COLLATE pg_catalog."default",
        song_album character varying(500) COLLATE pg_catalog."default",
        date_ecoute timestamp without time zone
    )

    Cette table contient une liste de son écouté de différents artiste, j'essaye de trouver les artistes les plus écoutés par semaine.
    j'ai essayé cette query
    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    with t1 as 
    (select *, 
    row_number() over (partition BY EXTRACT(month from date_ecoute) order by count(song_album) DESC) as rn from capge)
    select * from t1
    where rn <= 10
    j'obtient comme erreur
    ERROR: ERREUR: la colonne « capge.artist » doit apparaître dans la clause GROUP BY ou doit être utilisé dans une fonction d'agrégat
    LINE 2: (select *,
    J'utilise PostgreSQL , est ce que quelqu'un pourrait m'aider svp ?

  2. #2
    Modérateur
    Avatar de escartefigue
    Homme Profil pro
    bourreau
    Inscrit en
    Mars 2010
    Messages
    10 623
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Localisation : France, Loir et Cher (Centre)

    Informations professionnelles :
    Activité : bourreau
    Secteur : Finance

    Informations forums :
    Inscription : Mars 2010
    Messages : 10 623
    Billets dans le blog
    10
    Par défaut
    Bonjour,

    Avec la table telle que fournie, la requête suivante doit faire l'affaire

    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    select extract(week from date_ecoute) as sem
         , song_album                     as song
         , count(*)                       as nbr
    from capge
    group by  extract(week from date_ecoute)
            , song_album

    Cela étant dit, il faut d'urgence revoir le modèle de données : dans une table des écoutes, il ne devrait pas y avoir de titre d'album, ni de titre de chanson, ni de titre d'auteur, mais uniquement des clefs étrangères faisant références aux tables qui vont bien et une date et heure d'écoute (plus éventuellement la référence toujours sous forme de FK de l'auditeur, si l'écoute est nominative).
    De plus, le typage des données est mal choisi varchar(500) pour un auteur, sérieusement...
    Enfin, pourquoi extraire le mois alors que vous voulez un résultat par semaine...

  3. #3
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2020
    Messages
    31
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 25
    Localisation : Sénégal

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2020
    Messages : 31
    Par défaut
    Bonjour ,
    J'ai essayé votre solution et ça a effectivement résolu partiellement mon problème, je l'ai un peu modifié la requête parceque les valeurs j'ai plusieurs années dans ma colonne date_ecoute et je voulais un classement ordonné comme suit :
    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    select extract(week from date_ecoute) as sem
         , extract(year from date_ecoute) as yea
         , song_album                     as song
         , count(*)                       as nbr
     
    from capge
    group by  extract(week from date_ecoute)
    		,extract(year from date_ecoute)
    	    , song_album
     
    order by yea DESC,sem ASC, nbr DESC

    Le problème c'est que je ne peux pas mettre de limit à un group by pour récupérer les top (2 par exemple) par année et par semaine, c'est pour ça qu'initialement je voulais un row_number() . J'ai finalement pu faire ma requête précédente mais le résultat me donne les tops toute année confondue.

    Concernant le squelette de la base de données elle n'est pas volontaire, j'ai juste creer la table en fonction du d'un fichier csv que j'ai importé. Et pour le varchar(500) je me suis retrouvé avec des erreurs en diminuant la taille des chaînes.

  4. #4
    Expert confirmé
    Avatar de Séb.
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    5 342
    Détails du profil
    Informations personnelles :
    Âge : 47
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mars 2005
    Messages : 5 342
    Billets dans le blog
    17
    Par défaut
    Concernant le squelette de la base de données elle n'est pas volontaire, j'ai juste creer la table en fonction du d'un fichier csv que j'ai importé.
    Rien ne t'oblige à suivre le modèle de données plat de ton CSV
    En l'état ça peut fonctionner, mais tôt ou tard tu seras confronté à des difficultés. Et plutôt tôt que tard.

    Le problème c'est que je ne peux pas mettre de limit à un group by pour récupérer les top (2 par exemple) par année et par semaine, c'est pour ça qu'initialement je voulais un row_number() . J'ai finalement pu faire ma requête précédente mais le résultat me donne les tops toute année confondue.
    Il faut partitionner selon l'année et la semaine :

    Code SQL : Sélectionner tout - Visualiser dans une fenêtre à part
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    WITH dataset (y, w, song_album, n, r) AS (
        SELECT ALL
            EXTRACT(YEAR FROM date_ecoute), EXTRACT(WEEK FROM date_ecoute),
            song_album, COUNT(*),
            RANK() OVER (PARTITION BY EXTRACT(YEAR FROM date_ecoute), EXTRACT(WEEK FROM date_ecoute) ORDER BY COUNT(*) DESC)
        FROM capge
        GROUP BY 1, 2, 3
    )
    SELECT ALL *
    FROM dataset 
    WHERE r <= 2
    ORDER BY y DESC, w DESC, r ASC, song_album ASC;

    Je n'ai pas de serveur PostgreSQL et tu ne fournis pas de jeu de données, mais l'idée y est.

  5. #5
    Membre averti
    Homme Profil pro
    Étudiant
    Inscrit en
    Mai 2020
    Messages
    31
    Détails du profil
    Informations personnelles :
    Sexe : Homme
    Âge : 25
    Localisation : Sénégal

    Informations professionnelles :
    Activité : Étudiant

    Informations forums :
    Inscription : Mai 2020
    Messages : 31
    Par défaut
    Bonjour,
    je test ça dans la journée et je vous dit ce que ça a donné.
    Concernant le modèle de la base de données vous me suggérez de les séparer en combien de table? Le problème c’est que j’ai que ces 4 colonnes dans mon CSV et je vois pas comment faire des bonnes jointures si je les sépare pour mes requêtes .

  6. #6
    Expert confirmé
    Avatar de Séb.
    Profil pro
    Inscrit en
    Mars 2005
    Messages
    5 342
    Détails du profil
    Informations personnelles :
    Âge : 47
    Localisation : France

    Informations professionnelles :
    Secteur : High Tech - Opérateur de télécommunications

    Informations forums :
    Inscription : Mars 2005
    Messages : 5 342
    Billets dans le blog
    17
    Par défaut
    Citation Envoyé par cedrickab Voir le message
    Concernant le modèle de la base de données vous me suggérez de les séparer en combien de table?
    Ton CSV n'a que les colonnes "artist", "album", "song_album" et "date_ecoute" ? Jamais d'identifiants ? (ex. ISMN)
    song_album contient un numéro de piste ? Les collaborations, les feats sont représentées ? "artist", c'est l'artiste de l'album ou de la piste ?
    Tu ne donnes pas d'exemple de ta source de données...

    Un exemple simpliste, avec 1 artiste par album :

    artist
    --------
    id (PK)
    name

    album
    --------
    id (PK)
    name
    artist_id (FK => artist.id)

    track
    --------
    id (PK)
    number # Numéro de piste sur l'album
    name
    album_id (FK => album.id)

    listen
    --------
    id (PK)
    track_id (FK => track.id)
    listened_at

    Le problème c’est que j’ai que ces 4 colonnes dans mon CSV et je vois pas comment faire des bonnes jointures si je les sépare pour mes requêtes .
    Il faudrait récupérer/définir des identifiants pour l'artiste, l'album et la piste.
    Sinon tu auras du mal à gérer les homonymes et à monter en charge.
    Bon après tout dépend de l'ampleur du projet et des fonctionnalités visées. Dans l'absolu tu pourrais très bien te satisfaire d'un simple import brut de ton CSV

Discussions similaires

  1. Réponses: 4
    Dernier message: 30/03/2020, 16h00
  2. [XL-2016] Calculer le nombre d'occurrence de x par semaine
    Par abdullah-k dans le forum Macros et VBA Excel
    Réponses: 4
    Dernier message: 06/11/2017, 13h37
  3. [XL-2003] Calculer le nombre de lignes non vide d'une colonne
    Par zangaloni dans le forum Macros et VBA Excel
    Réponses: 3
    Dernier message: 13/07/2011, 15h30
  4. [XL-2003] calcule le nombre de ligne non vide dans une colonne donnée
    Par aefmaaradji dans le forum Excel
    Réponses: 2
    Dernier message: 27/07/2010, 15h08
  5. [WD12] calcul nombre de jours par semaine
    Par heiti dans le forum WinDev
    Réponses: 6
    Dernier message: 30/10/2008, 21h11

Partager

Partager
  • Envoyer la discussion sur Viadeo
  • Envoyer la discussion sur Twitter
  • Envoyer la discussion sur Google
  • Envoyer la discussion sur Facebook
  • Envoyer la discussion sur Digg
  • Envoyer la discussion sur Delicious
  • Envoyer la discussion sur MySpace
  • Envoyer la discussion sur Yahoo