展开数据框中使用熊猫
问题描述:
我一个功能集结构类似以下,其中有150个特色工作:展开数据框中使用熊猫
-1 45:1 55:1 67:1
1 55:1 65:1 89:1
如何使用熊猫扩大这个数据集,这样,它是一个完整的矩阵或阵列全部150个功能?在第一排功能换句话说44是0,所以我想用大熊猫做类似:
[-1,0,0,0,...(44th entry)0,1,...
1,0,0,0,...(54th entry)0,1,...]
基本上,我认为存在一个大熊猫办法做到这一点,所以我不写for循环并生成一个零矩阵并让它填充值。我是否想要做这样的事情:Fill a Pandas dataframe using information from another Pandas dataframe还是有更好的实施,因为我的问题似乎不太复杂。谢谢,因为我是熊猫新手。
答
原来的数据是svm_light
的格式,所以我用了认可的python模块 - 问题解决了!
我不明白你的输入数据是如何构成的,它是什么类型的对象?开头的-1和1是否应该是索引? – Emma
不,它们是二元分类器或想象像[y | x1 x2 x3,...] – eWizardII