如何从CSV从熊猫数据帧

问题描述:

删除“\ n”空值我有书面形式“\ n”一些空值的12064行×220列的csv文件。我正在通过读取csv数据到一个熊猫数据帧中: df = pd.read_csv('my_csv')如何从CSV从熊猫数据帧

对待/删除空值以便我可以对数据执行下游分析的最佳方法是什么?我想也许最好将'\ N'字符串转换为'NaN'并使用df.dropna()方法。如果这是最好的选择,我将如何做到这一点?谢谢。

+0

您是否尝试过'na_values'? –

我想也许这可能是最好的“\ n”字符串转换为 “男”,并使用df.dropna()方法

pandas.read_csv()有一个参数只是为

na_values : list-like or dict, default None 
Additional strings to recognize as NA/NaN. If dict passed, specific per-column NA values 

因此,例如

pandas.read_csv('my.csv', na_values=['\N']) 

然后你就可以轻松地使用它

裁判dropna()http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html