数据分析笔记--pandas的数据结构--Series和DataFrame
import pandas as pd
Series对象的创建
Series对象包括两个部分,索引和数据
可以通过列表或者其他序列来创建
通过head()可以只显示头部几个,比如前五个
.value和.index用来获取Series对象的数据和索引
.values返回的是numpy的ndarray类型的数组
通过索引来获取数据
通过字典来构建Series,字典的键将会作为他的行索引,字典的值作为数据
我们还可以通过.name给Series对象以及他的索引起别名
DataFrame对象的创建
1,通过二维数组创建DataFrame对象
2,通过字典创建DataFrame对象
由字典生成DataFrame对象的话, 字典的键会生成列索引,行索引会自动生成,行数会以字典中值最长的元素决定,不足此长度的列会以重复的行来进行补齐
但是如果想补齐列表或者数组这种值是会报错的:
如下“D”的元素个数有五个,“E”列表的元素个数为四个,当对这种形式的字典进行DataFrame转换时,由于列表的个数固定了,无法补齐,将会报出以下的错误
3,通过索引获取列
可以用以下两种方式
4,取出某个具体的数据,先取列索引,再取行索引,就能取出具体值了
5,增加新的列数据,可以通过原先的列创建新的列或者直接创建新的列
6.删除一列数据