Series的10大基本概念及代码案例-----初学基础
1.可以把Series看成一个定长的有序字典,向Series增加一行:相当于给字典增加一组键值对。
2.可以通过shape,size,index,values等得到series的属性
shape:形状
size:元素的个数
index:获取index的值,返回的是对象
values:获取value的值
*numpy tolist()的用法
3.可以使用head(),tail()分别查看前n个和后n个值
4.当索引没有对应的值时,可能出现缺失数据显示NaN(not a number)的情况
5.可以使用pd.isnull(),pd.notnull(),或自带isnull(),notnull()函数检测缺失数
6.使用bool型的列表访问数组对象
7.Series对象本身及其实例都有一个name属性
8.根据值排序
DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind=‘quicksort’, na_position=‘last’)
参数说明
by:str or list of str;如果axis=0,那么by=“列名”;如果axis=1,那么by=“行名”;
axis:{0 or ‘index’, 1 or ‘columns’}, default 0,默认按照索引排序,即纵向排序,如果为1,则是横向排序
ascending:布尔型,True则升序,可以是[True,False],即第一字段升序,第二个降序
inplace:布尔型,是否用排序后的数据框替换现有的数据框
kind:排序方法,{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。似乎不用太关心
na_position : {‘first’, ‘last’}, default ‘last’,默认缺失值排在最后面
9.根据索引排序
sort_index(axis=0, level=None, ascending=True, inplace=False, kind=‘quicksort’, na_position=‘last’,
axis:0按照行名排序;1按照列名排序
level:默认None,否则按照给定的level顺序排列—貌似并不是,文档
ascending:默认True升序排列;False降序排列
inplace:默认False,否则排序之后的数据直接替换原来的数据框
kind:排序方法,{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’
na_position:缺失值默认排在最后{“first”,“last”}
10.统计值出现的次数
去重操作,只统计出现的值
编者寄:文章面向小白也可能会被行业前辈看到,为避免知识误导,若文章有错误,还请过路朋友指出,末学好及时更正,评论区见~
整理于学习资料,比心图片来源网络;