机器学习的过程(代表性的思维图片):演变-核心基础-数学思维
1)机器学习的演变
- 机器学习的工作方式
①选择数据:将你的数据分成三组:训练数据、验证数据和测试数据
②模型数据:使用训练数据来构建使用相关特征的模型
③验证模型:使用你的验证数据接入你的模型
④测试模型:使用你的测试数据检查被验证的模型的表现
⑤使用模型:使用完全训练好的模型在新数据上做预测
⑥调优模型:使用更多数据、不同的特征或调整过的参数来提升算法的性能表现
2. 机器学习所处的位置
①传统编程:软件工程师编写程序来解决问题。首先存在一些数据→为了解决一个问题,软件工程师编写一个流程来告诉机器应该怎样做→计算机遵照这一流程执行,然后得出结果
②统计学:分析师比较变量之间的关系
③机器学习:数据科学家使用训练数据集来教计算机应该怎么做,然后系统执行该任务。首先存在大数据→机器会学习使用训练数据集来进行分类,调节特定的算法来实现目标分类→该计算机可学习识别数据中的关系、趋势和模式
④智能应用:智能应用使用人工智能所得到的结果,如图是一个精准农业的应用案例示意,该应用基于无人机所收集到的数据
3.
①符号主义:使用符号、规则和逻辑来表征知识和进行逻辑推理,最喜欢的算法是:规则和决策树
②贝叶斯派:获取发生的可能性来进行概率推理,最喜欢的算法是:朴素贝叶斯或马尔可夫
③联结主义:使用概率矩阵和加权神经元来动态地识别和归纳模式,最喜欢的算法是:神经网络
④进化主义:生成变化,然后为特定目标获取其中最优的,最喜欢的算法是:遗传算法
⑤Analogizer:根据约束条件来优化函数(尽可能走到更高,但同时不要离开道路),最喜欢的算法是:支持向量机
5. 机器学习的实际应用
机器学习有很多应用场景,这里给出了一些示例,你会怎么使用它?
快速三维地图测绘和建模:要建造一架铁路桥,PwC 的数据科学家和领域专家将机器学习应用到了无人机收集到的数据上。这种组合实现了工作成功中的精准监控和快速反馈。
增强分析以降低风险:为了检测内部交易,PwC 将机器学习和其它分析技术结合了起来,从而开发了更为全面的用户概况,并且获得了对复杂可疑行为的更深度了解。
预测表现最佳的目标:PwC 使用机器学习和其它分析方法来评估 Melbourne Cup 赛场上不同赛马的潜力。
传送门:https://zhuanlan.zhihu.com/p/26512893
机器学习必备知识思维图(集成库和常规网络库):
3)机器学习的理论依托
1)图解线性代数(线性代数+微积分+PCA提取): 传送门:https://www.zhihu.com/question/266533669/answer/377229055
1、图解学习linear algebra目的:高效求解大量linear equations
2、图解学习linear algebra目的:高效求解模型参数拟合大量数据
3、图解线性代数:线代如何切入帮助解决模型优化
4、图解线性代数:向量的本质和加乘运算
5、图解线性代数:vector length and dot product
6、图解线性代数:vector dot product, length, cosine
7、图解线性代数:scalar projection, vector projection
8、图解线性代数:vector projection 与 vector transformation
9、图解线性代数:linear combination, independence, basis vector
10、图解线性代数:vector, projection, basis vector在机器学习中的应用11、图解线性代数:matrix简介
12、图解线性代数:用映射projection来理解matrix的变形能力
13、图解线性代数:机器学习的本质与matrix transformation的各种形态
14、图解线性代数:matrix叠加变形的直观理解
15、图解线性代数:inverse与identity matrix的理解和求解
16、图解线性代数:determinant, inverse, dependence, solution
17、图解线性代数:einstein summation convention and dot product的对称性
18、图解线性代数:我的视野里的vector, basis vector在panda的视野里长得什么样子
19、图解线性代数:案例熊猫与人类的视野转换
20、图解线性代数:如何理解orthogonal matrix
21、图解线性代数:gram-schmidt与转换坐标空间来实现vector变形
22、图解线性代数:eigenvectors and eigenvalues
23、图解线性代数:eigenvectors and eigenvalues的求解逻辑
24、图解线性代数:用eigenvector, eigenvalues化简n个matrix的叠加变形计算
25、图解微积分:什么是函数,为什么说数学就是一门语言,微积分是干什么用的
26、图解微积分:如何直观理解calculus研究的输入值与输出值之间的变化关系
27、图解微积分:对derivative和gradient定义的直观理解
28、图解微积分:如何用sum和power规则来计算函数的derivative
29、图解微积分:特殊函数让多重derivative计算变得简单高效
30、图解微积分:2个函数相乘的复合函数的derivative推导过程(product rule)
31、图解微积分:chain rule多个函数套用的复合函数的derivative高效计算的直觉理解
32、图解微积分:如何用sum, product, power, chain rules解决看似极复杂的函数的derivative
33、图解微积分:如何直观理解independent, dependent variables, constant, 以及多变量函数的derivative的求解逻辑
34、图解微积分:直观理解total derivative的用途和构造
35、图解微积分:直观理解Jacobian的用途和构造
36、图解微积分:如何理解Jacobian matrix结构和用途
37、图解微积分:如何理解Jacobian在寻找函数全局和局部大小值时存在近视问题
38、图解微积分:如何理解Hessian matrix结构和用途
39、图解微积分:为什么深度学习中Jacobian hessian用不上而必须用numeric method
40、图解微积分:如何用Jacobian vector matrix解多个函数叠套且每个函数有多个变量的derivative
41、图解微积分:如何实现从神经网络图谱到vector matrix计算公式的转化(正向传递)
42、图解微积分:Jacobian vector matrix高效完成神经网络反向传递的逻辑和计算流程
43、图解微积分:引入Taylor series
44、图解微积分:maclaurin series的构造(Taylor series的特殊版)
45、图解微积分:Taylor series构造的由来
46、图解微积分:maclaurin, taylor series 案例求解
47、图解微积分:Expected error and multivariate taylor
图解PCA
图解机器学习:为什么要对数据做降维和压缩,可视化有助于理解压缩后的维度内涵
课程:Motivation I_ Data Compression Motivation II_ Visualization
笔记:为什么要对数据做降维和压缩,可视化有助于理解压缩后的维度内涵
图解机器学习:如何理解PCA是一种projection降维的最优方案以及PCA的算法逻辑
课程:Principal Component Analysis Problem Formulation
课程:Principal Component Analysis Algorithm
笔记:如何理解PCA是一种projection降维的最优方案以及PCA的算法逻辑
图解机器学习:PCA是如何通过K寻找最优的降维幅度的
课程:Choosing the Number of Principal Components
笔记:PCA是如何通过K寻找最优的降维幅度的
图解机器学习:如何理解PCA中的U_reduce, x, z, x_approximation的关系
课程:Reconstruction from Compressed Representation
笔记:如何理解PCA中的U_reduce, x, z, x_approximation的关系
图解机器学习:实际模型训练中如何正确使用PCA和规避常见错误用法
课程: Advice for Applying PCA
笔记:实际模型训练中如何正确使用PCA和规避常见错误用法