pandas处理nan的数据

在处理缺失值的时候，总会遇到各种问题
1.构造dataframe；
pandas处理nan的数据

1.删除全部为nan的行

2.删除含有nan的行

3.
删除全部为nan的列
df.dropna(axis=1,how=‘all’)
删除包含nan的列
df.dropna(axis=1,how=‘any’) #
4.删除指定某一列有nan，
这样即可定位到所在行的index，然后对该index进行drop操作即可
df[np.isnan(df[‘open’])].index #定位某一列是否有nan

直接drop对应indx即可删除该行
df.drop(df[np.isnan(df[‘open’])].index, inplace=True)
pandas处理nan的数据

5.
df1 = df.dropna(axis=0, how=‘all’, subset=[‘d’, ‘c’]) #删除指定的两列都是空的行

6.
df = df2.drop_duplicates(subset=“ASIN”, keep=‘first’) # 删除重复的，以ASIN码为唯一的值，以前面的一行进行保留
7.http://liao.cpython.org/pandas20/ 这个是《Python 做数据分析》一书的源码

pandas处理nan的数据

相关推荐