Bonsoir tout le monde,

Je suis débutant en Spark et j'essaye d'effectuer une requête me permettant de récupérer les pages webs les plus visitées.

Ma requête est la suivante:
Code : Sélectionner tout - Visualiser dans une fenêtre à part
mostPopularWebPageDF = logDF.groupBy("webPage").agg(functions.count("webPage").alias("cntWebPage")).agg(functions.max("cntWebPage")).show()
Avec cette requête, je récupère uniquement le dataframe avec seulement la colonne avec la valeur max sans avoir en plus la colonne concernant la page web. J'aimerais donc récupérer un Dataframe de la forme :

webPage max(WebPage)
url 2

Comment puis-je faire cela?

Merci à vous.