pandas处理nan的数据

在处理缺失值的时候,总会遇到各种问题
1.构造dataframe;
pandas处理nan的数据
pandas处理nan的数据
1.删除全部为nan的行
pandas处理nan的数据
2.删除含有nan的行
pandas处理nan的数据
pandas处理nan的数据
3.
删除全部为nan的列
df.dropna(axis=1,how=‘all’)
删除包含nan的列
df.dropna(axis=1,how=‘any’) #
4.删除指定某一列有nan,
这样即可定位到所在行的index,然后对该index进行drop操作即可
df[np.isnan(df[‘open’])].index #定位某一列是否有nan

直接drop对应indx即可删除该行
df.drop(df[np.isnan(df[‘open’])].index, inplace=True)
pandas处理nan的数据
pandas处理nan的数据
5.
df1 = df.dropna(axis=0, how=‘all’, subset=[‘d’, ‘c’]) #删除指定的两列都是空的行
pandas处理nan的数据
6.
df = df2.drop_duplicates(subset=“ASIN”, keep=‘first’) # 删除重复的 ,以ASIN码为唯一的值,以前面的一行进行保留
7.http://liao.cpython.org/pandas20/ 这个是《Python 做数据分析》一书的源码