python3数据分析第4天

pandas库


介绍:基于numpy创建

series

1 类似于以为数组对象,有一组数据和一组与之相关的数据标签组成

2 可以通过values和index属性获取表达形式和索引对象

   可以通过索引获取值

3  数据被存放在字典中,则也可以直接创建series

python3数据分析第4天

4 可以用pd.isnull( )   pd.botnull( ) 来判断 是否为缺失值NULL, series也有  obj.isnull()

5 series的索引可以通过赋值的方式修改

    obj.index = ['a', 'b']

dataframe

1 构建dataframe最常用是 直接传入一个由等长列表或numpy数组组成的字典

  python3数据分析第4天

2  可以有columns 指定顺序

python3数据分析第4天

3 传入的列在数据中找不到,就会产生NA值

4 获取列的方式,可以通过列

python3数据分析第4天

    可以通过索引,用    .ix  的方式,(frame2 是数据框 )

python3数据分析第4天

5  列可以通过赋值的方式修改

6  用del删除列    

python3数据分析第4天

注意  通过索引方式返回的是相应数据的视图,如做修改,对原数据也会修改

7  如若是嵌套字典的话,外层字典的键作为列,内层键作为行索引

8  可以输给dataframe的数据

python3数据分析第4天

9  如果设置了  index和columns的name属性,  则可以显示出来  通过  .name

10  values属性 也会以二维ndarray的形式返回dataframe中的数据

python3数据分析第4天