什么是人工智能?你需要知道的关于人工智能的一切

人工智能(Artificial Intelligence,AI)的执行指南讲述,从机器学习和通用人工智能到神经网络。

什么是人工智能?

这个问题取决于你问的对象是谁。

早在20世纪50年代,这个领域之父MinskyMcCarthy就将人工智能描述为由程序(program)或机器(machine)执行的任何任务,这些任务是,如果人类执行相同的活动,我们会说人类必须运用智力来完成这项任务。

显然,这是一个相当广泛的定义,这就是为什么您有时会看到关于某物是否真的是AI的争论的原因。

人工智能系统通常至少会展示出与人类智能相关的以下一些行为:规划(planning),学习(learning),推理(reasoning),问题解决(problem solving),知识表示(knowledge representation),感知(perception),运动(motion)和操作(manipulation),以及在较小程度上的社会智能(social intelligence)和创造力(creativity)。

AI有什么用?

如今,人工智能无处不在,比如它被用来向您推荐下一步应该在网上购买什么,了解您对亚马逊的Alexa和苹果的Siri等虚拟助手(virtual assistants)所说的话,识别照片中的人物和内容,发现垃圾邮件或检测信用卡欺诈

AI有哪些不同类型?

在很高的层次上,人工智能可以分为两种类型:狭义AI和通用AI(narrow AI,general AI)。

狭义AI是当今我们在计算机中所看到的一切:已经被教导或学会如何执行特定任务而无需明确编程如何执行这些任务的智能系统。

这种类型的机器智能很明显,如在Apple iPhone上的Siri虚拟助手的语音和语言识别(the speech and language recognition),自动驾驶汽车(self-driving cars)的视觉识别系统(the vision-recognition systems),根据您过去购买的产品来推荐您喜欢的产品的推荐引擎(the recommendation engines)。 与人类不同,这些系统只能学习或被教导如何执行特定任务,这就是为什么它们被称为狭义AI。

狭义AI能做什么?

狭义AI有大量的新兴应用:解释无人机(drones)对石油管道等基础设施进行视觉检查的视频信息,组织个人和企业日历,回应简单的客户服务(customer-service)查询,与其他智能系统配合以执行任务,例如在合适的时间和地点预订酒店,帮助放射线科医生在X射线中发现潜在的肿瘤,在网上标记不适当的内容,从IoT设备收集的数据中检测电梯的磨损,等等。

通用AI能做什么?

人工通用智能与众不同,它是在人类中发现的适应性智力(adaptable intellect )的类型,是一种灵活的智能形式,能够学习如何执行截然不同的任务,从理发到构建电子表格,或根据积累的经验推理各种各样的主题。 这类AI在电影中更为常见,例如2001年的HAL或The Terminator中的Skynet,但如今还不存在,而且AI专家们对于它多久会变成现实存在着激烈的分歧。

特别报告如何实施人工智能和机器学习(免费PDF)

AI研究人员Vincent CMüller和哲学家Nick Bostrom在2012/13年度对四组专家进行的一项调查显示,到2040年至2050年,人工通用智能(Artificial General Intelligence,AGI)的开发机会将达到50%,到2075年将上升到90%。 该小组甚至更进一步,预测所谓的“超级智能”(superintelligence),被Bostrom定义为“在所有感兴趣的领域中大大超过人类的认知(cognitive)表现的任何智力”,预计在AGI实现后约30年。

也就是说,一些AI专家认为,鉴于我们对人类大脑的了解有限,这样的预测是非常乐观的,并且认为AGI仍有几个世纪之遥。

什么是机器学习?

AI有着广泛的研究领域,其中许多研究相互补充。

当前机器学习(machine learning)正在兴起,它是向计算机系统馈送大量数据,然后用这些数据学习如何执行特定任务,例如理解语音或为照片加说明文字(captioning a photograph)。

什么是神经网络?

机器学习过程的关键是神经网络(neural networks)。 这些是由大脑启发的网络,由相互连接的算法层(layers)的组成,称为神经元(neurons),它们相互馈送数据,并且可以通过修改输入数据在各层之间传递的重要性来训练它们执行特定任务。 在训练这些神经网络的过程中,附加在不同输入上的权重(weights)将继续变化,直到神经网络的输出与期望的输出非常接近为止,此时网络将“学习”如何执行特定任务 。

机器学习的一个子集是深度学习(deep learning),在这种学习中,神经网络被扩展为具有大量层的庞大网络,这些层使用大量数据进行训练。 正是这些深度神经网络(deep neural networks)推动了当前计算机执行语音识别和计算机视觉等任务的能力的飞跃。

立即下载IT领导者深度学习指南(技术专业研究)(Tech Pro Research)

有各种类型的神经网络,各有优缺点。 循环神经网络(recurrent neural networks)是一种特别适合于语言处理和语音识别的神经网络,而卷积神经网络(convolutional neural networks)则更常用于图像识别。 神经网络的设计也在不断发展,研究人员最近改进了一种更有效的深度神经网络形式,称为长短时记忆或LSTM,使其能够足够快地运行以用于Google Translate等点播系统(on-demand systems )。

什么是人工智能?你需要知道的关于人工智能的一切

深度神经网络的结构和训练

AI研究的另一个领域是进化计算(evolutionary computation),它借鉴了达尔文(Darwin)的著名自然选择(natural selection)理论,并发现遗传算法(genetic algorithms)经历了几代之间的随机突变(random mutations)和组合(combinations),试图进化出给定问题的最优解决方案(the optimal solution)。

这种方法甚至被用来帮助设计AI模型,有效地利用AI来帮助构建AI。这种使用进化算法用于优化神经网络的方法称为神经进化(neuroevolution),并且随着智能系统的使用变得越来越普遍,尤其是当对数据科学家的需求经常超过供给时,这种方法在帮助设计高效AI方面可以发挥重要作用。 Uber AI Labs最近展示了该技术,该实验室发布了有关使用遗传算法训练深度神经网络以解决强化学习(reinforcement learning)问题的论文

最后还有专家系统(expert systems),在这种系统中,用规则(rules)对计算机进行编程,使它们可以基于大量输入来做出一系列决策(decisions),从而使机器能够模仿(mimic)特定领域中人类专家的行为。这些基于知识的系统(knowledge-based systems)的一个例子可能是驾驶飞机的自动驾驶系统(an autopilot system)。

是什么推动了AI的复兴?

近年来,AI研究的最大突破是在机器学习领域,尤其是在深度学习领域。

这在某种程度上是由于数据的易获得性所驱动,但更重要的是由于近年来并行计算能力的爆炸式增长,在此期间,使用GPU集群来训练机器学习系统变得更加普遍。

这些集群不仅为训练机器学习模型提供了强大得多的系统,而且现在可以作为Internet上的云服务广泛使用。随着时间的推移,像Google和Microsoft这样的主要科技公司已经转向使用专门针对运行和最近用于训练机器学习模型的专用芯片(chips)。

这些定制芯片中的一个例子是Google的Tensor处理单元(Tensor Processing Unit,TPU),其最新版本加快了使用Google TensorFlow软件库构建的有用的机器学习模型从数据中推断信息的速率,以及它们被训练的速率。

这些芯片不仅用于训练DeepMind和Google Brain的模型,还用于支持Google Translate和Google Photo中的图像识别的模型,以及允许公众使用Google的TensorFlow Research Cloud构建机器学习模型的服务。第二代这些芯片已于去年5月在Google的I/O会议上揭晓,其中的一系列新TPU能够训练用于翻译的Google机器学习模型,所需时间仅为高端图形处理单元(graphics processing units,GPU)的一半

机器学习的要素是什么?

如前所述,机器学习是AI的一个子集,通常分为两大类:监督学习和非监督学习。

监督学习

教导AI系统的一个常用技术是通过使用大量带标签的例子(labeled examples)来训练它们。 这些机器学习系统被馈入大量数据,这些数据已被标注以突出感兴趣的特征。 这些可能是被标记以表明它们是否包含狗的照片,或带有脚注以表明“bass”一词与音乐还是鱼类有关的书面句子。 经过训练后,系统便可以将这些标签(labels)应用于新数据,例如刚刚上传的照片中的一只狗。

这种通过例子教导机器的过程称为监督学习(supervised learning),标记这些例子的角色通常由在线工作人员执行,他们通过Amazon Mechanical Turk之类的平台雇用

另请参阅人工智能如何使call centers更上一层楼

训练这些系统通常需要大量的数据,有些系统需要搜寻数百万个例子来学习如何有效地执行任务,尽管在大数据和大规模数据挖掘的时代,这越来越有可能。训练数据集庞大且规模不断扩大,Google的Open Images Dataset拥有约900万张图像,而其带有标签的视频存储库YouTube-8M链接了700万个带有标签的视频。 ImageNet是此类早期数据库之一,拥有超过1400万张分类图像。该文件经过两年的编写,由近50,000人(其中大部分是通过Amazon Mechanical Turk招募的)汇集在一起​​的,他们检查,分类并标记了将近10亿张候选图片。

从长远来看,与庞大的计算能力相比,访问具有大量标记数据集的重要性可能不那么重要。

近年来,生成对抗网络(Generative Adversarial Networks,GANs)展示了机器学习系统如何通过馈入少量标记数据然后能够生成大量新数据来自学。

这种方法可能会导致半监督学习(semi-supervised learning)的兴起,在半监督学习中,系统可以使用远远少于当今使用监督学习的训练系统所需要的标记数据来学习如何执行任务。

非监督学习

参考资源

[1] What is AI? Everything you need to know about Artificial Intelligence