第一章 准备工作
学习《利用python进行数据分析》
书中代码
土豪链接
免费连接
第一章 准备工作
Numpy:数值计算。
pandas:高级数据结构和函数。
matplotlib:制图和可视化库
SciPy:科学计算领域针对不同标准问题域的包集合。
- scipy.integrate :数值积分例程和微分方程求解器
- scipy.linalg:线性代数例程和基于numpy.linalg的矩阵分解
- scipy.optimize :函数优化器和求根算法
- scipy.signal :信号处理工具
- scipy.sparse:稀疏矩阵与稀疏线性系统求解器
- scipy.special :SPECFUN的包装器
- scipy.stats:标准的连续和离散概率分布(密度函数、采样器、连续分布函数)、各类统计测试、各类描述性统计。
scikit-learn首选的机器学习工具包,包括子模块:(预测)
- 分类:SVM、最近邻、随机森林、逻辑回归等
- 回归:Lasso、岭回归
- 聚类:K-means、谱聚类等
- 降维:PCA、特征选择、矩阵分解等
- 模型选择:网格搜索、交叉验证、指标矩阵等
- 预处理:特征提取、正态化
statsmodels是一个统计分析包,包含经典的统计学、经济学算法,子模型:(统计推理)
- 回归模型:线性回归,通用线性模型、鲁棒线性模型、线性混合效应模型等
- 方差分析(ANOVA)
- 时间序列分析:AR、ARMA、ARIMA、VAR等
- 非参数方法:核密度估计、核回归
- 统计模型结果可视化
命令提示符中退出python
- 方法1:exit()
- windows:按下ctrl+z
- linux或macOS:按下ctrl+d