的Python,熊猫连接多个dataframes
问题描述:
我有使用pd.read_csv()
的Python,熊猫连接多个dataframes
目前我正在试图通过CSV列表进行迭代,并使用pd.concat()
方法和轴参数设置到其中一个予加载作为数据帧的CSV文件的列表一个按列添加所有数据帧。
它正在工作,但希望我遇到的问题是,由于所有的数据帧都具有相同的colums的名字时,我串连他们,我得到例如10列所有关键“日期”
有无论如何,我可以给colums所有独特的名字例如London_Date,Berlin_Date?显然这些名字是基于数据框的名字。
答
如果传递的密钥列表来concat()
,然后你可以单独指标要与给定的键,像这样的任何列:
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3']},
index=[0, 1, 2, 3])
df2 = df1
df3 = df1
add = pd.concat([df1, df2, df3], axis = 1, keys=['Group_1', 'Group_2', 'Group_3'])
print(add.Group_1.A) # or add.Group_2.B etc...
如果你知道如何避免列,你可以删除他们的权利 –
可能的重复[选择/排除熊猫集列](http://*.com/questions/14940743/selecting-excluding-sets-of-columns-in-pandas) –