数据分析笔记--pandas的数据结构--Series和DataFrame

import pandas as pd

Series对象的创建

Series对象包括两个部分,索引和数据

可以通过列表或者其他序列来创建

数据分析笔记--pandas的数据结构--Series和DataFrame

通过head()可以只显示头部几个,比如前五个

数据分析笔记--pandas的数据结构--Series和DataFrame

.value和.index用来获取Series对象的数据和索引

.values返回的是numpy的ndarray类型的数组

数据分析笔记--pandas的数据结构--Series和DataFrame

通过索引来获取数据

数据分析笔记--pandas的数据结构--Series和DataFrame

通过字典来构建Series,字典的键将会作为他的行索引,字典的值作为数据

数据分析笔记--pandas的数据结构--Series和DataFrame

数据分析笔记--pandas的数据结构--Series和DataFrame

我们还可以通过.name给Series对象以及他的索引起别名

数据分析笔记--pandas的数据结构--Series和DataFrame

DataFrame对象的创建

1,通过二维数组创建DataFrame对象

数据分析笔记--pandas的数据结构--Series和DataFrame

2,通过字典创建DataFrame对象

数据分析笔记--pandas的数据结构--Series和DataFrame

由字典生成DataFrame对象的话, 字典的键会生成列索引,行索引会自动生成,行数会以字典中值最长的元素决定,不足此长度的列会以重复的行来进行补齐

但是如果想补齐列表或者数组这种值是会报错的:

如下“D”的元素个数有五个,“E”列表的元素个数为四个,当对这种形式的字典进行DataFrame转换时,由于列表的个数固定了,无法补齐,将会报出以下的错误

数据分析笔记--pandas的数据结构--Series和DataFrame

3,通过索引获取列

可以用以下两种方式

数据分析笔记--pandas的数据结构--Series和DataFrame

4,取出某个具体的数据,先取列索引,再取行索引,就能取出具体值了

数据分析笔记--pandas的数据结构--Series和DataFrame

5,增加新的列数据,可以通过原先的列创建新的列或者直接创建新的列

数据分析笔记--pandas的数据结构--Series和DataFrame

6.删除一列数据

数据分析笔记--pandas的数据结构--Series和DataFrame