Bonjour à tous,

J'ai trouvé le code suivant (contexte de préparation/ gransformation des données Big Data pour être analysées)
Le code enrichie les données initiales de deux nouveaux attributs : CountryGDP et CountryPopulation

Ce sont toutes les informations données sur ce bout de code, je voudrais savoir ce que fait chaque ligne indépendamment car je n'arrive pas à comprendre le code.

Serait t il possible de me mettre des commentaires sur les lignes ?


Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
 
 
 
# -*- coding: utf-8 -*- 
from dataiku import Dataset 
import pandas as pd 
# Input datasets
customer_shaked = 
Dataset("customer_shaked").get_dataframe() 
CountryGDP = Dataset("CountryGDP").get_dataframe() 
CountryPopulation = Dataset("CountryPopulation").get_dataframe() 
CountryGDP.columns=['country','GDP_inhab'] 
CountryPopulation.columns=['country','population'] 
customer_shaked=pd.merge(customer_shaked,CountryGDP) 
customer_shaked=pd.merge(customer_shaked,CountryPopulation)
# Output datasets 
customer_enriched = Dataset("customer_enriched") 
customer_enriched.write_with_schema(customer_shaked)

MErci et bonne journée !