如何从CSV从熊猫数据帧
问题描述:
删除“\ n”空值我有书面形式“\ n”一些空值的12064行×220列的csv文件。我正在通过读取csv数据到一个熊猫数据帧中: df = pd.read_csv('my_csv')
如何从CSV从熊猫数据帧
对待/删除空值以便我可以对数据执行下游分析的最佳方法是什么?我想也许最好将'\ N'字符串转换为'NaN'并使用df.dropna()方法。如果这是最好的选择,我将如何做到这一点?谢谢。
答
我想也许这可能是最好的“\ n”字符串转换为 “男”,并使用df.dropna()方法
pandas.read_csv()
有一个参数只是为
na_values : list-like or dict, default None
Additional strings to recognize as NA/NaN. If dict passed, specific per-column NA values
因此,例如
pandas.read_csv('my.csv', na_values=['\N'])
然后你就可以轻松地使用它
裁判dropna()
,http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html
您是否尝试过'na_values'? –