机器学习几个重要概念的区别

机器学习几个重要概念的区别

1、人工智能、机器学习、深度学习的关系

【笔记】机器学习是人工智能的一个分支,深度学习是实现机器学习的一种技术。

机器学习是研究如何使计算机能够模拟或实现人类的学习功能,从大量的数据中发现规律,提取知识,并在实践中不断地完善和增强自我。机器学习是机器获取知识的根本途径,只有让计算机系统具有类似人的学习能力,才可能实现人工智能的终极目标。

机器学习是人工智能研究的核心问题之一,也是当前人工智能研究的一个热门方向,同时也是人工智能理论研究和实际应用的主要瓶颈之一。

机器学习几个重要概念的区别

如上图,区别三者最简单的方法:想象同心圆,人工智能(AI)是半径最大的同心圆,向内是机器学习(Machine Learning),最内是深入学习(Deep Learning)。人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,当今人工智能大爆炸的核心驱动。

深度学习使得许多机器学习应用得以实现,并拓展了人工智能的整个领域。深度学习一一实现了各种任务,并使得所有的机器辅助变成可能。无人驾驶汽车、电影推荐等,都触手可及或即将成为现实。人工智能就在现在,也在未来。有了深度学习,人工智能可能甚至达到像我们畅想的科幻小说一样效果。

( 更简单理解)人工智能是祖辈,机器学习是父辈,深度学习是儿子辈!

2、数据分析和数据挖掘的基本概念

首先我们了解什么是数据,什么是信息?

(1) 数据— 即观测值,例如测量数据,你的身高,体重都是测量数据。

(2) 信息:(信息抽象地说就是)可信的数据。

数据——>信息:数据和信息最大的区别就是一个是客观一个是主观。如:用尺子量桌子宽度,测量得到的值就是数据,这是客观存在的。

而对于用户而言只会关心桌子是长还是短、高还是低,大了买小的等。这种主观对客观数据的接受和在描述,就是信息。

(3) 数据分析 : 对数据的一种操作手段 , 目标是经过先验 ( 已有经验 ) 的约束 , 对数据进行整理、筛选和加工,最后得到信息。【从数据到信息的转化过程】

(4) 数据挖掘:是对数据分析之后的信息,进行价值化的分析。【信息的价值化】

(5) 数据挖掘和数据分析的关系

第一层是递归的关系:
【笔记】数据分析的结果是信息,这些信息作为数据又去数据挖掘。 而数据挖掘,又使用了数据分析的手段,如此反反复复。

数据挖掘和数据分析最大区别:

  • 数据分析,以输入数据为基础,通过先验约束,对数据进行处理,但是不以结论如何做调整。(重在于数据有效性、真实性和先验约束正确性)
  • 数据挖掘,是对信息的价值化的获取。价值化自然不考虑数据本身,而是考虑数据是否有价值。由此,一批数据,尝试对他做不同的价值评估,就是数据挖掘。对比数据分析,最大的特点就是你需要调整你的不同的先验约束,在此对数据进行分析。

(6)举例 1: 钻戒的例子
你打算跟你女朋友买戒指,那么你手上有一批品牌和款式名单,你按照价格、风格、材质分类,得到如下结论:

  • 钻石戒指比钢戒贵
  • 大钻戒比小钻戒贵
  • 钢戒样式比较多、钻戒款式少

这就是数据分析,根据你的先验约束(按照什么划分)获得的结论,但是不是最贵的你女朋友就最喜欢,而对于男同胞来讲就是需要用最少的钱让你女朋友最开心,由此我们需要进行数据挖掘。

最优的标准就是最少的投入,最大的开心。因此,任务就是根据先验(历史数据)去寻找贵的戒指不买的理由,比如钻戒款式少、大钻戒要比钢戒要小。同时你要去问问你女朋友怎么样才开心。

于是,我们又去做数据分析,此时实际上是使用价值的评判标准,对数据进行价值化。因此如果你确定了分析方式,则动作确实是数据分析,但是带上了确定价值化的评价标准动作,这就是数据挖掘。

最后的最后,你得到了理由既花钱少又能让女朋友开心。

(7)举例 2: 买菜的例子
老婆早上给你 50 元让你买一天的菜,要求鸡猪鱼肉俱全,且蛋菜葱蒜豆品必备。于是你屁颠屁颠的到了菜市场先是饶了一圈,在各个档口拉拉家常,问问价格。猪肉十几块一斤,好一点品种的鱼也很贵,数据分析下来,拿出手机打开计算器的 App 噼里啪啦的按,数字长的比韭菜还长,最后得到一个价格,这就是数据分析。根据客观的数据,先验的公式得到的信息。

但是对你而言,最大的价值是:用最少的钱满足老婆要求,还可以留点私房钱和朋友吃饭等。那么现在就要开始数据挖掘了,但是你必须具备评价标准。

多少肉算一天的量
猪肉、鱼肉、各种肉怎么个选法
青菜白菜都是菜,便宜营养我最爱

怎么个选法才能让老婆满意,同时价格落于你可承受的范围。于是,根据设定的范围,包括菜怎么卖、肉怎么买、中饭怎么配、晚饭怎么配等,最终可以确定一个都买方案,这就是数据挖掘。

(8) 总结:

  • 数据分析:针对历史数据,分析得出各项指标,经过数据分析我们得到的是信息。
  • 数据挖掘[ 大量的数据挖掘规律]: : 经过数据挖掘我们得到的是有价值的信息 , 即对信息进行价值提取或数据挖掘。

举例: 啤酒和尿布的故事

  • 数据分析(信息):根据沃尔玛历史销售数据,分别分析买各种商品的人各自具有什么特征。
  • 数据挖掘(有价值的信息):根据历史销售数据,使用关联规则挖掘,分析买了啤酒的人还会购买什么,从而得出尿布。

3、各技术点的交叉

了解了数据挖掘,我们在介绍下机器学习和数据挖掘的关系。

用机器学习的方法来进行数据挖掘。机器学习是一种方法;数据挖掘是一件事情;还有一个相似的概念就是模式识别,这也是一件事情。而现在流行的深度学习技术只是机器学习的一种;(看下图)

解释:机器学习就是让机器从数据中学习模型,模型可形象地理解为预测力,机器学习侧重于模型的构建。深度学习是机器学习的一种,属于当前比较热的领域,属于机器学习技术的重大突破,因此你可以看到人脸识别、机器翻译等人工智能领域的产品越来越神奇。数据挖掘是从一堆数据中发现潜在价值的过程,有时会用机器学习算法,有时不需要用。

机器学习几个重要概念的区别

人工智能是研究如何让机器具有类人智能的学科,目标是让机器具有人类的智能。机器学习,是达到人工智能目标的手段之一;模式识别也是达到人工智能的手段之一。

如上图所示,对数据挖掘而言,数据库提供数据管理技术,机器学习和统计学提供数据分析技术。

人工智能范围比较大,机器学习相对来说属于人工智能的范畴。数据挖掘则是将机器学习作为工具,利用机器学习的算法用来完成数据挖掘。另外数据挖掘也使用到其他很多内容。

喜欢就点赞评论+关注吧

机器学习几个重要概念的区别

感谢阅读,希望能帮助到大家,谢谢大家的支持!