pandas入门之DataFrame

1、创建DataFrame:

(1)从剪贴板创建:pandas入门之DataFrame

(2)通过Series创建:

pandas入门之DataFrame

需要进行转置:

pandas入门之DataFrame

2、DATa Frame的常规操作:

(1)查看列名:

pandas入门之DataFrame

pandas入门之DataFrame

(2)获取特定某一列的values:

方法一:

pandas入门之DataFrame

方法二(此时生成一个新的DataFrame):

pandas入门之DataFrame

方法三(此时所返回值为Series):

pandas入门之DataFrame

pandas入门之DataFrame

方法四(返回多列,对于此种方法必须使用'[ ]')

df1[['capital','lowercase']]

pandas入门之DataFramepandas入门之DataFrame

(3)对DataFrame增加新的列:

pandas入门之DataFrame

对新加的列赋值:

pandas入门之DataFrame

pandas入门之DataFrame

pandas入门之DataFrame

对新加列部分赋值:

pandas入门之DataFrame

(4)读DataFrame的行:

pandas入门之DataFrame

注意:每一行为一个tuple,且长度为2。

3、DataFrame的IO操作:

(1)读粘贴板:df=pd.read_clipboard(),将粘贴板中的内容转为DataFrame数据,并存入df

(2)写粘贴板:df1.to_clipboard(),将df1中的内容写入粘贴板(然后就可以方便地直接粘入excel)

(3)写CSV文件:df1.to_csv('路径\文件名.csv', index=True/False)

(4)读CSV文件:df2=pd.read_csv('df1.csv')

(5)写excel文件:df1.to_excel('df1.xlsx')

4、查看DataFrame内容:

(1)iloc,其参数分别为行列的index,通过index进行定位。

pandas入门之DataFrame

pandas入门之DataFrame

(2)loc,其参数为行列的lable(名称),利用lable进行定位。

pandas入门之DataFrame

5、更改索引

(1)更改Series索引:

pandas入门之DataFrame

增加了一个索引‘E’,默认赋值为NaN。我们可以在增加索引的同时,对其进行赋值,具体如下:

pandas入门之DataFrame

(2)更改DataFrame索引:

pandas入门之DataFrame

6、删除

(1)删除Series的值

pandas入门之DataFrame

(2)删除DataFrame的值

删除DataFrame的列(注意此时axis=1):

pandas入门之DataFrame

删除DataFrame的行(注意此时axis=0): df1.drop('A', axis=0)

7、DataFrame中增加列

(1)利用Series

pandas入门之DataFrame

(2)利用字典

pandas入门之DataFrame