1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
|
import pandas as pd
test=open("ma_db.csv","r")
data_p1=[]
data_p2=[]
data_p3=[]
# Parcours de toutes les lignes de notre fichier en lecture
for line in test:
# Découpage de nos variables avec le séparateur : fonction split()
id_c, id_p, id_s = line.split("^")
_, *end = id_p.split("=")
# end correspond aux listes des id de chaque individus
# si end a 3 éléments dans sa liste alors on récupère le dernier élément
if len(end) == 3:
id_p3 = end[2]
if '{' in id_p3:
id_p3=id_p3[1:-1]
variables=id_c_3,id_p3_test,id_s_3=(id_c,id_p3,id_s[0:-2])
vars_3=list(variables)
data_p3.append(vars_3)
elif len(end) == 2:
id_p2=end[1]
if '{' in id_p2:
id_p2=id_p2[1:-1]
variables=id_c_2,id_p2_test,id_s_2=(id_c,id_p2,id_s[0:-2])
vars_2=list(variables)
data_p2.append(vars_2)
elif len(end) == 1:
id_p1=end[0]
if '{' in id_p1:
id_p1=id_p1[1:-1]
variables=id_c_1,id_p1_test,id_s_1=(id_c,id_p1,id_s[0:-1])
vars_1=list(variables)
data_p1.append(vars_1)
df_1 = pd.DataFrame(data_p1, columns = ['id_c','id_p_propre','id_s'])
df_2 = pd.DataFrame(data_p2, columns = ['id_c','id_p_propre','id_s'])
df_3 = pd.DataFrame(data_p3, columns = ['id_c','id_p_propre','id_s'])
ma_db_propre=pd.concat([df_1, df_2,df_3], ignore_index=False) |
Partager