pandas入门(七)
带有重复标签的轴索引
=====================================
索引的is_unique属性可以告诉你它的值是否是唯一的。
=====================================
带有重复值的索引,数据选取的行为将会有些不同。如果某个索引对应多个 值,则返回一个Series;而对应单个值的,则返回一个标量值。
=====================================
索引的输出类型会根据标签是否有重复发生变化。
汇总和计算描述统计
pandas对象拥有一组常用的数学和统计方法。它们大部分都属于约简和汇总统计, 用于从Series中提取单个值(如sum或mean)或从DataFrame的行或列中提取一个 Series。跟对应的NumPy数组方法相比,它们都是基于没有缺失数据的假设而构建的。
=====================================
调用DataFrame的sum方法将会返回一个含有列的和的Series
=====================================
传入axis='columns’或axis=1将会按行进行求和运算
=====================================
NA值会自动被排除,除非整个切片(这里指的是行或列)都是NA。通过skipna选 项可以禁用该功能
=====================================
有些方法(如idxmin和idxmax)返回的是间接统计(比如达到最小值或最大值的索引)
=====================================
另一些方法则是累计型的
=====================================
describe就是一个例子,它用于一 次性产生多个汇总统计
=====================================
对于非数值型数据,describe会产生另外一种汇总统计
++++++++++++++++++++++++++++++++++++