第一章 准备工作

学习《利用python进行数据分析》

第一章 准备工作

书中代码

土豪链接
免费连接

第一章 准备工作

Numpy:数值计算。

pandas:高级数据结构和函数。

matplotlib:制图和可视化库

SciPy:科学计算领域针对不同标准问题域的包集合。

  • scipy.integrate :数值积分例程和微分方程求解器
  • scipy.linalg:线性代数例程和基于numpy.linalg的矩阵分解
  • scipy.optimize :函数优化器和求根算法
  • scipy.signal :信号处理工具
  • scipy.sparse:稀疏矩阵与稀疏线性系统求解器
  • scipy.special :SPECFUN的包装器
  • scipy.stats:标准的连续和离散概率分布(密度函数、采样器、连续分布函数)、各类统计测试、各类描述性统计。

scikit-learn首选的机器学习工具包,包括子模块:(预测)

  1. 分类:SVM、最近邻、随机森林、逻辑回归等
  2. 回归:Lasso、岭回归
  3. 聚类:K-means、谱聚类等
  4. 降维:PCA、特征选择、矩阵分解等
  5. 模型选择:网格搜索、交叉验证、指标矩阵等
  6. 预处理:特征提取、正态化

statsmodels是一个统计分析包,包含经典的统计学、经济学算法,子模型:(统计推理)

  1. 回归模型:线性回归,通用线性模型、鲁棒线性模型、线性混合效应模型等
  2. 方差分析(ANOVA)
  3. 时间序列分析:AR、ARMA、ARIMA、VAR等
  4. 非参数方法:核密度估计、核回归
  5. 统计模型结果可视化

命令提示符中退出python

  1. 方法1:exit()
  2. windows:按下ctrl+z
  3. linux或macOS:按下ctrl+d