进入AI领域做产品 —— 我的自学之路(AI基础概念)
AI概念认知
了解AI
什么是AI
AI是实现推断的概率可以无限逼近100%,最终替代人类做判断、完成任务,甚至超越人类思维和判断能力的科学技术。
AI产品
互联网时代的产品经理构建的是基础设施,在人与人、人与物、人与数据的关系上搭建桥梁,实质上是优化了信息存储和互通的方式,因此产品经理主要关注的是入口及流量的走向。
AI实际上给人类带来的是技术创新驱动下的产业升级,本质上是关注产品本身的价值。
AI产品,本质上是全面优化和提升上述所有场景中现有的技术手段,从而实现用户的体验升级和解决方案的效率升级。
核心要素
算法、数据、算力3要素是构成AI的根本,3要素的突破是当下AI得以迅速发展的原因,AI 产品经理需要对3要素有深刻的认知以便更好的去进行设计。
算法
概念:
得到输入后能够输出预测、分类结果的AI模型,相当于土壤。
意义:
- 近些年来算法框架的不断成熟及开源社区的发展大幅度降低了执行算法的门槛;
- 对于AI 产品经理而言,设计的产品要和公司现有的算法研发能力相匹配,例如避免设计一些 过于超前或落后的产品功能。这需要AI 产品经理对主流的算法模型和框架有基本的认知,并可以做到对各种算法在不同场景下的使用效果进行量化评估。
算法大类:
- 浅层机器学习;
- 深度学习;
- 增强学习。
数据
概念:
作为输入内容提供给AI模型,相当于养料。
意义:
- 互联网和移动互联网的迅猛发展在数据层面提供了AI学习的基础;
- 对于AI 产品经理而言,要在产品设计之初就考虑到数据从哪来、数据质量怎么保证、数据治理的工作怎么开展等问题。
数据采集方法:
- 各种传感器;
- 摄像头;
- 麦克风;
- 触摸屏;
- 网络数据采集器。
计算能力
概念:
- 作为把输入数据在AI模型中运算后输出结果的工具,相当于锄头;
- 只有用锄头(算力)在土壤(算法)中施加养料(数据),才能结出果实(结果)。
意义:
- 以 GPU、TPU 为核心的大规模集群计算系统的发展及硬件成本的逐步降低基本扫清了计算能力的障碍;
- 对于AI 产品经理而言,要从需求出发,衡量产品的功能所需求的算法模型需要怎样的系统架构支撑,并能够评估硬件开销。
AI芯片:
-
通用性芯片GPU:
- GPU是单指令、多数据处理,采用数量众多的计算单元和超长的流水线,主要处理图像领域的运算加速;
- GPU无法单独工作,必须由CPU进行控制调用才能工作;
- CPU可单独作用,处理复杂的逻辑运算和不同的数据类型,但当需要大量的处理类型统一的数据时,则可调用GPU进行并行计算。
-
半定制化芯片FPGA:
- FPGA适用于多指令,单数据流的分析,与GPU相反,因此常用于预测阶段,如云端;
- FPGA是用硬件实现软件算法,因此在实现复杂算法方面有一定的难度,缺点是价格比较高。
-
全定制化芯片ASIC:
- ASIC是为实现特定场景应用要求时,而定制的专用AI芯片;
- 除了不能扩展以外,在功耗、可靠性、体积方面都有优势,尤其在高性能、低功耗的移动设备端。
-
类脑芯片:
- 类脑芯片架构是一款模拟人脑的神经网络模型的新型芯片编程架构;
- 这一系统可以模拟人脑功能进行感知方式、行为方式和思维方式。
云计算技术:
-
概念:
- 简单的云计算概念即是将任务分解给无数服务器计算后再将结果合并返回;
- 高弹性、高效、高性价比;
- 利用云计算可以大大提升AI学习时的运算效率。
-
服务类型:
-
基础设施即服务 IaaS:
- 提供最基础的物理计算机资源服务,最底层的纯计算机资源服务,计算、网络、存储上的虚拟化以及弹性。
-
平台即服务 PaaS:
- 提供具备相应开发环境的计算资源服务,应用层面的弹性。
-
软件即服务 SaaS:
- 提供应用软件相关的资源,用于可以直接使用应用软件和数据库。
-
基础设施即服务 IaaS:
核心领域分类
图像和视觉处理
计算机视觉 CV:
将图像、视频信号转化为机器可理解的信息的过程,相当于人的眼睛。
机器视觉 MV:
用机器代替人眼来做测量和判断。
生物特征识别:
利用人体所固有的生理特征(指纹、虹膜、面相等)或行为特征(步态、击键习惯等)来进行个人身份鉴定的技术。
虚拟现实 VR:
利用计算机生成一种模拟环境,使用户沉浸到该环境中。
增强现实 AR:
是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术。
混合现实 MR:
是VR的进一步发展,该技术通过在现实场景呈现虚拟场景信息,在现实世界、虚拟世界和用户之间搭起一个交互反馈的信息回路,以增强用户体验的真实感。
即时定位与地图构建 SLAM:
将一个机器人放入未知环境中的未知位置,让机器人在移动中逐步描绘出此环境完全的地图。
语音和文字处理
自然语言处理 NLP/语义理解:
NLP及NLU是理解和处理文字的过程,相当于人的大脑。
语言识别 ASR:
将声音转化为文字的过程,相当于人的耳朵。
语音合成 TTS:
将文字转化为语音的过程,相当于人的嘴巴。
人机交互 HCI:
产品形态的语音助手。
认知和推理
机器学习 ML :
根据过往经验生成具有泛化能力的模型,在遇到新的问题时能做出精准判断。
AI产业链
基础层 —— 上游
概述:
这一层的企业,从AI领域底层的需求为导向,为下游提供基础设施建设。所以这一层的产品经理对于底层技术框架、技术原理、实现理解的权重更高。
数据层:
各行业/场景的一手数据获取。
计算能力层:
- 云计算开发;
- GPU/FPGA等硬件开发;
- 神经网络芯片开发。
技术层 —— 中游
概述:
这一层的企业,是以技术算法迭代为主导,提供AI基础功能软件供客户(2B)调用的,所以这一层的产品经理对于商业技巧、技术原理理解的权重更高。
通用技术层:
- 计算机视觉CV;
- 自然语言处理NLP等技术领域研究。
算法层:
- 机器学习;
- 深度学习;
- 增强学习等各种算法开发。
框架层:
- TensorFlow;
- Caffe;
- Theano;
- Torch;
- DMTK;
- DTPAR;
- ROS等框架或系统开发。
应用层 —— 下游
概述:
这一层的企业是最多的,它们利用AI在行业场景中寻找落地点,用AI赋能产品,所以这一层的产品经理对于行业、业务理解的权重将更高。
我认为,相较于以上两层,这一层是对于非全栈互联网产品经理转型的较优切入点。
解决方案层:
如自动驾驶、智能家居等场景应用开发。
应用平台层:
- 行业应用分发和运营平台;
- 机器人运营平台等应用平台开发。
AI发展
国内AI市场
我国AI市场规模在2017年就已经达到237亿,较上年增涨67%,其中计算机视觉市场规模最大,占34.9%。随着2018年AI开始进入商用元年,预计在2019,市场规模超越700亿。
以此可预期,AI这个我将要依附的经济体正在以一个飞快的速度崛起。
发展与瓶颈
第一次谈到发展这个话题,则要分享我近期对“发展”的理解,我们都在谈论发展的历史、瓶颈、技术边界…但是把它们列出来了之后,我发现很少有人去把这些点其中的关系描述出来。
也许是大家都已经在认知中非常熟悉其中关系所以一笔带过,但是我第一次理解这个概念——“限制条件”之后,利用它将“行业发展历史、发展趋势、瓶颈、技术边界”之类的零碎点串联到了一起。
一切事情是否会“发展”在于“限制”它们的“条件”,是否成熟了而已。
基于这个认知,我可以去分析很多已经发生的事情的因果关系、去预期很多没有发生的事情的可能概率…比如老生常谈的AI因为3要素限制的突破得到发展,再比如医美技术的成熟让很多人突破了其外在条件对其目标追求的阻碍…
对于我来说,将它们串联的目的只有一个—— 让我面对问题时,更好地去选择以及取舍。
所以关于串联,我特别想引用张竞宇老师在其书中提到的,乔布斯的一次关于“电视行业的瓶颈”采访,看乔布斯是如何串联的:
“电视行业的创新困境是由于市场推广策略导致的。”—— 限制条件是什么
“电视行业中“补贴”的商业模式,给每个用户一个机顶盒。(很低廉的月消费甚至免费)”—— 进一步定义限制条件
“结果导致了用户面临的尴尬局面:自己的HDMI高清接口被不同的机顶盒占满了,而且每种机顶盒配套的UI都不一样,遥控器有一大堆。” —— 限制条件对“用户价值”的影响
“因为这样的商业模式,导致没有人愿意单独购买机顶盒了。(顺便列举具体的公司佐证)”—— “用户价值”对“商业价值”的影响
“唯一能改变这种局面的方式就是‘回到原点’,将所有的机顶盒都拆掉,换成一个具有唯一UI的机顶盒。但是目前无法实现这样的局面,因为我们改变不了目前主流的推广策略,而这与技术、远见无关。” —— 解决方案,试图突破根本的限制
“手机之所以和运营商合作推广,是因为手机的GSM即移动电话标准是全球统一的。但是电视不一样,每个国家都有自己的标准和*监管方案。” —— 最根本的限制无法突破的原因,形成边界
再回顾一遍:发展历史 → 发展趋势 → 出现瓶颈 → 找寻限制条件 → 定义限制条件 → 剖析限制条件带来的影响 → 分析限制条件如何突破 → 分析无法突破的原因 → 形成边界
纵观访谈中乔布斯的应答逻辑,乔布斯串联了每一个关键节点:
你不可能从现在预测到未来,只有回头看时,才会发现事物之间的联系。所以你必须相信那些生命中的点点滴滴,将会在你未来的生命里,以某种方式串联。你必须始终相信一些东西——你的勇气、宿命、生活、因缘,随便什么,它们将给你追寻内心真正所想的自信,带你走离平凡,变得与众不同。”
发展趋势:
关于“发展趋势”与“当下的发展”其实是有一些歧义的,我的观点是“发展趋势”是事情演变最本质的走向——弱人工智能走向强人工智能。
“发展趋势”因为各种“限制条件”出现而达到暂时的瓶颈,而“当下的发展”更像是对瓶颈的突破——去突破一个个限制条件。
关于瓶颈:
基于“弱人工智能走向强人工智能”这个发展趋势,可以进行分解:
- 当下是“弱人工智能”时代;
-
当下朝着“强人工智能”这个方向努力,而“强人工智能”包含以下要求:
- 强智能化——具备独立进行迅速、强力解决问题的能力、推理能力:
- 机器/深度学习。
- 强人性化——突破语义鸿沟,具备感官、真实情感、自我意识,通过图灵测试:
- 计算机视觉;
- 语义理解;
- 语音识别/合成。
- 强智能化——具备独立进行迅速、强力解决问题的能力、推理能力:
-
当下对于以上要求的能力不足,限制了“强人工智能”的发展,并处在了“弱人工智能”这个瓶颈中:
- 低级的推理能力 —— 大量的计算、监督、限制环境;
- 知识面局限;
- 看不透彻;
- 听不明白;
- 说不利索;
- 不像真人…
-
这些限制条件带来的影响是:
- “用户价值”方面:因为AI整体来说并不聪明,用户的信任感并不高,体验也并不好,导致消费的意愿不强,产生的数据不够多;
- “商业价值”方面:因为消费的意愿不强,企业没有利润和投资的支撑,生存受到了考验,即推动AI发展的动力源就会变得低效,算法迭代速度不够快;
- “投入”方面:投入即是“科研”以及“投资”,因为市场的热情不高,导致投资人更加谨慎,资金的涌入更少。而科研方面因为没有市场的刺激,意愿变弱…
- 而对于瓶颈的突破——即是需要付出长期、巨大的努力来对一个个限制条件进行单点**,最后将它们有机串联在一起、融合在一起。
当下的发展 —— 用户角度:
人性化:
- 单纯的简单、精准交互将逐渐不能满足用户需求,用户对AI的期望以及标准将逐步提升,将会需求更人性化、更便宜的服务。
- 将AI变得更聪明、更像人,能在更开放、复杂的环境下解决问题,除了推动深度学习的迭代、视觉、语音的突破之外,将语音与视觉结合来交付体验是消费级市场的更大期望。
例子:
-
智能家居:
- 现在仍然是较为被动的服务体系,需要用户大量干预,例如需要根据用户的主动开关来唤醒或是做出反应,体验不自然,能提供的服务也多局限在单点,串联感很弱且智能感不足。
- 提供更智能的内核并结合视觉与语音,基于用户的生活方式来提供精准、快速、人性化的服务将值得期待。
-
自动驾驶:
- 现在的自动驾驶场景,AI以及用户的视觉注意力在外部;
- 当自动驾驶技术达到完全成熟之后,出行场景将完全改变,AI和用户的注意力将会回到内部,AI将利用更智能的内核并结合视觉与语音为这个场景提供人性化服务。
当下的发展 —— 企业角度:
智能化:
- 当下越来越多传统行业的企业开始重视AI,并进行数字化,利用机器智能来赋能其垂直业务来代替劳动密集化,2B业务的成长速度将非常快;
- 但是基于用客户、用户的升级需求、标准,要想刺激他们消费来提升利润,AI企业就要迎合这个上升的标准做出创新,基于无监督的方向迭代深度学习算法,把服务变得更加智能,并提供更棒的用户体验;
- 领域的突破与融合正在进行中。
商业化:
- 基于“智能化”中提到的压力,现在AI企业将从技术为王转到变现为王,如何找到场景、理解场景、融入技术、落地产品并创造营收已经势在必行;
- 技术能力随着开源以及渐渐趋同,市场已经开始要求AI企业横向拓展规模,纵向下沉业务,在单一业务领域创造的利润难以支撑其高估值;
- 所以AI企业在证明自身价值吸引资金之外,还有一个意义是通过资金实力来刺激“学产结合”、人才加盟,只有这一环做好了,才能推动限制突破,没有资金一切将成为空谈。
云端化:
- 大数据+AI算法+云计算 三位一体,越来越多传统企业注重收集线上线下数据、打通、分析,并利用云计算为大数据提供存储和分析;
- 整个世界产生的数据将越来越趋向数字化,因为没有数据的指导企业就会与时代脱节,这一压力下间接为AI的限制突破提供了不断壮大的基础力量。
思考
思考一个问题,如果AI的风停了,怎么办?
2018年的技术成熟度曲线,可以看出深度学习开始从“期望膨胀的顶峰期”下滑。
并且,不久或将进入“泡沫化的谷底期”,AI这股风的力度也将逐渐减弱,不禁会产生一个疑问—— 如果风停了,怎么办?
当下的趋势:
-
还是回到刚才“限制条件”的思路,“风”即是“当下的趋势”,“当下的趋势”是试图对“限制条件”的突破;
-
“当下的趋势”是附着在经济上,受到经济周期的制约的;
-
产生“当下的趋势”,更本质的原因是因为概念的潜在价值可能会为资本方带来非常高的回报。
企业:
- 组织是附着在“当下的趋势”上,顺势获得更大的价值的;
- 风停了,资本下行撤出,某些企业没有资本的支撑而没落。
个人:
- 人是附着在企业上,利用企业为自身赋能、实现愿景的;
- 风停了,必定是尝试突破某一“关键条件”时短期看不到希望;
- 对于个人来说,首先思考我们具体身处在何处,再去考虑“关键条件”与我们身处位置的关系,去思考更本质的原因是什么,做到心中有数。
我的观点是:“遵循初心即可,风口是人为的、易变的,但是世界运行的价值规律是不易变的”:
- 对于组织来说,能把握风口、找到正确商业模式落地并抓住用户,那么风停了组织依然无惧,因为它依然可以持续为用户提供很高的价值从而长盛不衰;
- 而对于个人来说,本质也是价值,我需要关心自己作为AI产品经理的世界观、个人价值是否也在不断进化,而最核心的是——初心是否经得住考验以及变迁。
- 最后,引用旷视CEO印奇的观点:
“历史上所有沉淀下来的伟大公司,都是那些能够跨越多个商业周期的公司,一定是着眼长期,建立核心竞争力,聚焦产品本质。”、“商业的逻辑亘古不变,大道至简,不会被人为的风口改变,只是你愿不愿意承认而已。”
小结
这一章开始对AI是什么、对促成AI发展有哪些关键的因素等有了初步的认知,这是学习一件新事物的开端必不可少的环节,它也搭建“内视”框架的起点。
随着对AI的不断了解,也对AI即将构造的未来世界越来越心生向往,能够参与其中去为其添砖加瓦也将是一次长线以及浩大的工程,所以,坚持终身学习并不断进化吧!