获取数据框中列的最后一个值,而指数
问题描述:
假设我有一个数据帧,例如:获取数据框中列的最后一个值,而指数
df = pd.DataFrame(np.random.randn(10,5), columns = ['a','b','c','d','e'])
,我想找回在E列的最后一个值。我可以这样做:
df['e'].tail(1)
但是这会返回一个索引为9的系列。理想情况下,我只想获得价值作为我可以直接使用的数字。我也可以这样做:
np.array(df['e'].tail(1))
但是这会要求我访问/调用它的第0个元素,然后才能真正使用它。有没有更直接/简单的方法来做到这一点?
答
你可以尝试数据帧的iloc
方法:
In [26]: df
Out[26]:
a b c d e
0 -1.079547 -0.722903 0.457495 -0.687271 -0.787058
1 1.326133 1.359255 -0.964076 -1.280502 1.460792
2 0.479599 -1.465210 -0.058247 -0.984733 -0.348068
3 -0.608238 -1.238068 -0.126889 0.572662 -1.489641
4 -1.533707 -0.218298 -0.877619 0.679370 0.485987
5 -0.864651 -0.180165 -0.528939 0.270885 1.313946
6 0.747612 -1.206509 0.616815 -1.758354 -0.158203
7 -2.309582 -0.739730 -0.004303 0.125640 -0.973230
8 1.735822 -0.750698 1.225104 0.431583 -1.483274
9 -0.374557 -1.132354 0.875028 0.032615 -1.131971
In [27]: df['e'].iloc[-1]
Out[27]: -1.1319705662711321
如果你只是想访问一个标值,最快的方法是使用
at
和iat
方法,这是对所有的数据结构
In [28]: df.e.iat[-1]
Out[28]: -1.1319705662711321
标杆的实施:
In [31]: %timeit df.e.iat[-1]
100000 loops, best of 3: 18 µs per loop
In [32]: %timeit df.e.iloc[-1]
10000 loops, best of 3: 24 µs per loop