Python中的Numpy(axis = 0 和 axis = 1)区分
python中axis究竟如何定义的?它究竟代表的是DataFrame的行还是列?考虑以下:
我们调用mean(axis = 1),将得到按行计算的均值
但我们调用drop,实际上删除了一列而不是一行
其实问题在于我们理解axis有问题:
mean(axis = 1)其实是在每一行上取所有列的均值,而不是保留每一行的均值。
简单来记就是axis = 0代表跨行(down),axis = 1 表示跨列(across)
换句话说:
使用0表示沿着每一列 或 行标签/索引值向下执行方法
使用1表示沿着每一行 或 列标签横向执行对应的方法
下图表示在DataFrame当中axis为0和1时分别代表的含义:
axis参数作用方向图示
Pandas保持了Numpy对关键字axis的用法,用法在Numpy库的词汇表当中有过解释:
轴用来为超过一维的数组定义的属性,二维数据拥有两个轴:第0轴沿着行的垂直往下,第1轴沿着列的方向水平延伸。
所以问题当中第一个列子 df.mean(axis=1)代表沿着列水平方向计算均值,而第二个列子df.drop(name, axis=1) 代表将name对应的列标签(们)沿着水平的方向依次删掉。