Python数据分析值numpy库
numpy库
函数应用:
arange(N)//生成一个含有N个参数的一维向量;
reshape((N,M))//将一个向量进行重塑,生成N*M维向量;
transpose()//用于数组的转置;简单的转置用.T 高维的数组转置要用到一个由轴编号组成的元组;
randn(N,M)//random中生成随机矩阵的函数;
np.dot(arr.T,arr)//用于计算矩阵的内积XTX;
ndarray()的swapaxes()//需要一组轴编号;
sqrt()//求平方根 exp()求e次幂
np.maximum(x,y)//x,y均为一个矩阵,maximun返回两个矩阵中相应位置比较的一个大的值;
矢量化:用数组表达式代替循环;(快)
matplot库中的.imshow(z,M)
.colorbar()//绘制颜色条
.title("ggg")//添加图标
.sort()用于排序;
.unique(names);//去重 sorted(set(names))
.in1d(values,[m,n])//测试m,n是否在valus中,返回boolean;
np.save()和np.load()写、读磁盘数组数据的两个主要函数;
np.savez()将多个数组保存到一个压缩文件中;
eg:np.savaz('array_archive.npz',a=arr,b=arr)
arch=np.load('array_archive.npz') arch['b'](类似ker-value)
pandas库中有read_csv和read_table函数;
还可以用np.loadtxt和np.genfromtxt将数据加载到普通的numpy数组中;
arr=np.loadtxt('array_ex.txt',delimiter=',')
genfromtxt类似于loadtxt但是面向结构化的数组和缺失数据处理;
from numpy.linalg import inv,qr
samples= np.random.normal(size=(4,4))