pandas入门之DataFrame
1、创建DataFrame:
(1)从剪贴板创建:
(2)通过Series创建:
需要进行转置:
2、DATa Frame的常规操作:
(1)查看列名:
(2)获取特定某一列的values:
方法一:
方法二(此时生成一个新的DataFrame):
方法三(此时所返回值为Series):
方法四(返回多列,对于此种方法必须使用'[ ]')
df1[['capital','lowercase']]
(3)对DataFrame增加新的列:
对新加的列赋值:
对新加列部分赋值:
(4)读DataFrame的行:
注意:每一行为一个tuple,且长度为2。
3、DataFrame的IO操作:
(1)读粘贴板:df=pd.read_clipboard(),将粘贴板中的内容转为DataFrame数据,并存入df
(2)写粘贴板:df1.to_clipboard(),将df1中的内容写入粘贴板(然后就可以方便地直接粘入excel)
(3)写CSV文件:df1.to_csv('路径\文件名.csv', index=True/False)
(4)读CSV文件:df2=pd.read_csv('df1.csv')
(5)写excel文件:df1.to_excel('df1.xlsx')
4、查看DataFrame内容:
(1)iloc,其参数分别为行列的index,通过index进行定位。
(2)loc,其参数为行列的lable(名称),利用lable进行定位。
5、更改索引
(1)更改Series索引:
增加了一个索引‘E’,默认赋值为NaN。我们可以在增加索引的同时,对其进行赋值,具体如下:
(2)更改DataFrame索引:
6、删除
(1)删除Series的值
(2)删除DataFrame的值
删除DataFrame的列(注意此时axis=1):
删除DataFrame的行(注意此时axis=0): df1.drop('A', axis=0)
7、DataFrame中增加列
(1)利用Series
(2)利用字典