Besoin d'explication d'un code
Bonjour à tous,
J'ai trouvé le code suivant (contexte de préparation/ gransformation des données Big Data pour être analysées)
Le code enrichie les données initiales de deux nouveaux attributs : CountryGDP et CountryPopulation
Ce sont toutes les informations données sur ce bout de code, je voudrais savoir ce que fait chaque ligne indépendamment car je n'arrive pas à comprendre le code.
Serait t il possible de me mettre des commentaires sur les lignes ?
Code:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
|
# -*- coding: utf-8 -*-
from dataiku import Dataset
import pandas as pd
# Input datasets
customer_shaked =
Dataset("customer_shaked").get_dataframe()
CountryGDP = Dataset("CountryGDP").get_dataframe()
CountryPopulation = Dataset("CountryPopulation").get_dataframe()
CountryGDP.columns=['country','GDP_inhab']
CountryPopulation.columns=['country','population']
customer_shaked=pd.merge(customer_shaked,CountryGDP)
customer_shaked=pd.merge(customer_shaked,CountryPopulation)
# Output datasets
customer_enriched = Dataset("customer_enriched")
customer_enriched.write_with_schema(customer_shaked) |
MErci et bonne journée !