扯扯机器学习

扯扯机器学习

这是第篇神扯:扯扯机器学习

 

虽然,AI火了很久,但是谈起人工智能、机器学习、深度学习这些概念,吃瓜群众还是一脸懵逼。

 

扯扯机器学习

 

今天,我们来系统讲讲,这些概念到底有啥区别和联系。

 

下面这张图看得比较明白,人工智能、机器学习和深度学习,其实三者是层层包含的关系。

 

扯扯机器学习

 

人工智能的概念,起源于1950年代,包含多个分支,比如专家系统、进化计算、模糊逻辑、推荐系统,也包括最重要的分支:机器学习。

 

说白了,机器学习是实现人工智能的方法之一。

 

而机器学习,又细分了很多种学习“方法”:有监督学习、无监督学习、强化学习、深度学习等等。

 

先来简单扒一扒各种学习方法——

 

▌有监督学习

 

扯扯机器学习

 

由“专家”先把数据的特征标记好,交给机器来学习这些特征,然后,机器会得到一个“模型”。这个过程,称之为训练

 

扯扯机器学习

 

得到“模型”以后,机器在看到没有标记的新数据,也能活学活用,把符合模型特征的找出来。这个过程,称之为推理

 

这个学习过程,有所谓的砖家参与“监督”,所以叫做“有监督学习”。

 

 

▌无监督学习

 

扯扯机器学习

 

整个过程,没有砖家参与标注数据,所有的数据都是一脸懵逼的进去,机器经过一番研究之后,会懵懂滴从中找出一些规律,然后输出结果。

 

比如,机器并不能学习并识别猫的模型,但是可从海量的猫图片中,发现黑猫白猫两大类,然后把他们分类。

 

这,就是“无监督学习”。

 

 

▌强化学习

在机器学习中,还有一种方法,叫做强化学习,俗称:打一巴掌,给个甜枣。

 

扯扯机器学习

 

扯扯机器学习

 

让机器对问题作出判断,如果机器给出了错误的答案,就对机器进行“惩罚”,给与负面反馈。

 

扯扯机器学习

 

扯扯机器学习

 

如果机器给出了正确的答案,就对机器进行“奖励”,给与正面反馈。

 

整个过程,很像训练马戏团的猴子,久而久之,机器对这类事物的判断就会越来越趋向正确的方向。

 

通过奖惩来进行强化,这就是“强化学习”。

 

 

▌深度学习

接下来,轮到了机器学习领域最重要的方法:深度学习。

 

扯扯机器学习

 

深度学习也使用了有监督/无监督学习的方法,但近10年里,深度学习发展迅猛,现在已经在机器学习中自成一派,成了当红炸子鸡。

 

虽然深度学习并不像上面图中那样,把机器沉在深水中学习,但是,深度学习的“水”还是挺深的。

 

扯扯机器学习

 

深度学习采用了“深度神经网络”,这个“深度”其实是指神经网络的层数。

 

神经网络有点像一个多级的水管系统,左边是数据输入,中间设置了很多阀门,通过不断调节每个阀门的出水量,最终,让右边的输出,达到我们预期的结果。

 

扯扯机器学习

 

不断调节阀门、优化结果的过程,就是对神经网络进行训练,这个过程需要大量的数据输入,也需要消耗大量的算力。

 

最终,训练优化好的“水管网”(模型),才能部署到生产系统中,学以致用。

 

如果从0到1回放整个过程,我们会发现,要完成一次机器学习/深度学习实战,非常复杂。

 

扯扯机器学习

扯扯机器学习

 

六步跑下来,一顿操作猛如虎。

 

企业需要有数据、有算力、懂算法、懂场景,要有数据科学家、行业业务专家、系统工程师、开发工程师、运维工程师……

 

难怪AI落地这么难,因为这个过程确实很艰辛。

 

幸运的是,现在主流的公有云服务商,都逐步开始推出全托管式的机器学习平台。

 

这就像是个机器学习全家桶,在云上一站式搞定机器学习的所有流程。

 

扯扯机器学习

 

在这其中,AWS推出的Amazon SageMaker表现格外出众,堪称“桶神”。

 

这个桶里,包含了一系列的工具,从数据集准备到模型构建、训练、监控、优化,再到生产部署、大规模扩展,全部一站式完成。

 

扯扯机器学习

 

无论数据科学家还是开发者,甚至是吃瓜小白尝鲜,都可以轻松玩转机器学习。

 

扯扯机器学习

 

从编写代码、创建任务、多人协作,到开启训练、部署模型、参数调优、迭代回溯,以及后期的应用和规模化部署,屁股不挪窝,就可以轻松走起来。

 

再举个具体的例子吧↓

 

Amazon SageMaker有个很强大的机器学习自动化组件,叫做Autopilot,它能自动训练模型,并让使用者能了解和控制整个过程而不是只提供个黑盒模型。

 

扯扯机器学习

 

Amazon SageMaker ,贯穿了整个机器学习的工作流程,而且所有组件全部支持按需付费,让机器学习投入生产省时、省力、省钱!

 

目前,全球已经有数以万计的客户利用SageMaker加快机器学习部署,如今,这种便利,中国用户也可以享受到了↓

 

扯扯机器学习

2020年4月30日,Amazon SageMaker在AWS中国(宁夏)区域和(北京)区域双双正式上线!

扯扯机器学习

 

如果我们再通盘捋一遍AWS的AI能力,就会发现,SageMaker只是一个“小全家桶”,而AWS还有个更大的“AI全家桶”。

 

这个“大桶”,分三层——

 

扯扯机器学习

 

扯扯机器学习 最上层,是AWS预制的各类通用人工智能服务,比如视觉识别、语音识别、文字翻译、反欺诈检测等等,可以直接调用。

 

扯扯机器学习 中间层,就是SageMaker了,是机器学习一条龙服务,快速构建、训练和部署自己的模型。

 

 

扯扯机器学习 最下面一层,是机器学习基础架构,包含了各种框架、算法、专门用于ML的系统镜像和容器,还有CPU/GPU资源,以及AWS为AI定制的硬件和芯片。这一层,可以让资深人员或者组织,创建更为复杂的机器学习任务。

 

SO,如果你想实战AI,随手选个“桶”,搞定!