根据df中的两列值累积数据python

问题描述：

我想累积基于ID和月份的数据使用量，以便将累积数据作为附加列添加。根据df中的两列值累积数据python

这是我对DF的样本代码：

df = pd.DataFrame({'ID':["SAD1", "SAD2", "SAD1", "SAD2", "SAD1", "SAD2", "SAD3"], 
       'Month':["201701","201701","201702","201702","201703","201703", "201703"], 
       'Usage':[20,40,100,50, 30, 30, 2000]})

我的数据框看起来是这样的：

 ID Month Usage 
0 SAD1 201701  20 
1 SAD2 201701  40 
2 SAD1 201702 100 
3 SAD2 201702  50 
4 SAD1 201703  30 
5 SAD2 201703  30 
6 SAD3 201703 2000

我想结束了，结果是：

 ID Month Usage Cum Usage 
0 SAD1 201701  20   20 
1 SAD2 201701  40   40 
2 SAD1 201702 100  120 
3 SAD2 201702  50   90 
4 SAD1 201703  30  150 
5 SAD2 201703  30  120 
6 SAD3 201703 2000  2000

任何人都可以帮助我如何将这个应用到我的DF？

'DF [ '射精用法'] = df.groupby（[ 'ID']）。cumsum（）'？ – Abdou

答

groupby和cumsum

df['Cum Usage'] = df.groupby('ID').cumsum()

根据df中的两列值累积数据python

相关推荐