如何根据特定列值创建总数据中的新数据框?
问题描述:
比方说,我有一个数据帧,看起来是这样的:如何根据特定列值创建总数据中的新数据框?
A B C
X U 500
X S 300
X T 200
Y F 20
Y G 980
Z L 400
我想用在列中的特定值,因此{X,Y,Y}以及基于这些价值观,我想取C行总和并将其输出到新的数据帧中。我的新数据框中应该像这样的事情
A B
X 1000
Y 1000
Z 400
它基本上是由名在A列分组值,同时从每个这些值的A C的总和,并创建一个名为新数据框指定在与C列的总数列A
我需要它拿起自行这些值,因为我的想象有数据帧200行和A列80个不同的值
答
用途:
df = df.groupby('A', as_index=False)['B'].sum()
或者:
df = df.groupby('A')['B'].sum().reset_index()
非常感谢! – sgerbhctim
我可以通过电子邮件发送一些问题 - 我注意到您的个人资料上的电子邮件? – sgerbhctim
是的,当然。没问题。 – jezrael