根据列表从数据集中选择某些特征。
问题描述:
我有一个数据集“h_train”其具有约26的功能和我有一个列表ħ其具有从数据集“h_train”一些选定的特征。我只想让这些功能中的“h_train”这是目前在列表H.根据列表从数据集中选择某些特征。
h_train #Dataset with 26 features [A - Z]
H = ["A", "B", "C", "D"]
所以我想h_train减少到只有H.这些功能我该怎么办呢?
答
可以transfrom列表到元组数据结构,比起诉其运营
a = tuple(h_train)
b = tuple(H)
c = a & b
only_H_features_left = list(c)
答
假设h_train
是pd.DataFrame
你可以做
h_train = h_train[H]
'h_train = h_train [H]'假设' h_train'是一个'DataFrame'。 – Sevanteri
@Sevanteri非常感谢!它确实有效。 :) – Sahil
dataframes通过传递列标签列表来支持子选择,因此Sevanteri的答案是正确和最简洁的答案 – EdChum