如何计算大熊猫人均指数的平均值

如何计算大熊猫人均指数的平均值

问题描述:

我有一个1米行和层次索引(国家,州,城市,按此顺序)的熊猫数据框与每行产品的价格观察值。我如何计算每个国家,州和城市的平均值和标准差(标准差)(请记住我避免循环,因为我的df很大)? 对于mean和std的每个级别,我希望将这些值保存在此数据框的新列中以供将来访问。如何计算大熊猫人均指数的平均值

使用groupby与参数levels来分组您的数据,然后使用meanstd。如果你想拥有你的意思是新列在您现有的数据帧,使用transform其具有相同索引返回Series作为DF:

grouped = df.groupby(level = ['Country','State', 'City']) 
df['Mean'] = grouped['price_observation'].transform('mean') 
df['Std'] = grouped['price_observation'].transform('std') 

如果您想了解更多关于分组,您可以阅读pandas documentation