Python将大型numpy数组转换为熊猫数据框
问题描述:
我收到一小段代码,它只能在熊猫数据框中作为输入使用。我目前有一个非常大的numpy数组。我需要将其转换为熊猫数据框。Python将大型numpy数组转换为熊猫数据框
Dataframe将288行(289个列名)和1801列。我有一个大小为1801的数组,它将成为数据框中的所有列名称。然后我有一个大小的数组(288),它将填充第一列。然后我有一组形状(1800,288),将填充2-1801列。有没有一种简单的方法可以把它变成一个数据框,而不需要单独定义所有的1801列?
我知道我可以定义像column2 = array [0 ,:],column3 = array [1 ,:]这样的列,但是对于1801列来说这将是很多工作。
答
您可以直接传递一个numpy的阵列到数据帧的构造函数:
In [11]: a = np.random.rand(3, 5)
In [12]: a
Out[12]:
array([[ 0.46154984, 0.08813473, 0.57746049, 0.42924157, 0.34689139],
[ 0.29731858, 0.83300176, 0.15884604, 0.44753895, 0.56840054],
[ 0.02479636, 0.76544594, 0.24388046, 0.06679485, 0.94890838]])
In [13]: pd.DataFrame(a)
Out[13]:
0 1 2 3 4
0 0.461550 0.088135 0.577460 0.429242 0.346891
1 0.297319 0.833002 0.158846 0.447539 0.568401
2 0.024796 0.765446 0.243880 0.066795 0.948908
In [14]: pd.DataFrame(a.T)
Out[14]:
0 1 2
0 0.461550 0.297319 0.024796
1 0.088135 0.833002 0.765446
2 0.577460 0.158846 0.243880
3 0.429242 0.447539 0.066795
4 0.346891 0.568401 0.948908