如何删除整列,如果一个特定的行Python中
问题描述:
一个数据帧我有这样一个数据帧有重复的值,如何删除整列,如果一个特定的行Python中
df,
Name City
0 sri chennai
1 pedhci pune
2 bahra pune
有在城市列重复。
我想:
df["City"].drop_duplicates()
,但它仅给出特定列。
我的期望输出应该是
output_df
Name City
0 sri chennai
1 pedhci pune
答
您可以使用:
df2 = df.drop_duplicates(subset='City')
,如果你希望将结果存储在一个新的数据帧,或:
df.drop_duplicates(subset='City',inplace=True)
,如果你想更新df
。
这产生:
>>> df
City Name
0 chennai sri
1 pune pedhci
2 pune bahra
>>> df.drop_duplicates(subset='City')
City Name
0 chennai sri
1 pune pedhci
这将因此仅采取City
重复考虑在内,在Name
重复被忽略。
+0
我想我需要阅读更多文档 – pyd
有没有第1行可能被删除而不是第2行的情况? –