python3数据分析第4天
pandas库
介绍:基于numpy创建
series
1 类似于以为数组对象,有一组数据和一组与之相关的数据标签组成
2 可以通过values和index属性获取表达形式和索引对象
可以通过索引获取值
3 数据被存放在字典中,则也可以直接创建series
4 可以用pd.isnull( ) pd.botnull( ) 来判断 是否为缺失值NULL, series也有 obj.isnull()
5 series的索引可以通过赋值的方式修改
obj.index = ['a', 'b']
dataframe
1 构建dataframe最常用是 直接传入一个由等长列表或numpy数组组成的字典
2 可以有columns 指定顺序
3 传入的列在数据中找不到,就会产生NA值
4 获取列的方式,可以通过列
可以通过索引,用 .ix 的方式,(frame2 是数据框 )
5 列可以通过赋值的方式修改
6 用del删除列
注意 通过索引方式返回的是相应数据的视图,如做修改,对原数据也会修改
7 如若是嵌套字典的话,外层字典的键作为列,内层键作为行索引
8 可以输给dataframe的数据
9 如果设置了 index和columns的name属性, 则可以显示出来 通过 .name
10 values属性 也会以二维ndarray的形式返回dataframe中的数据