为什么现在不看好 CV 方向了呢?
作者:陈历飞
链接:https://www.zhihu.com/question/383486199/answer/1192004116
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
长期看好,短期谨慎。
随便翻开一个深度学习入门课程,你都会看到一个叫“手写数字识别”的项目——堪称人工智能领域的hello world。
调调CNN,跑跑ResNet,自我感觉良好,似乎每一个AI从业者,都可以是CV领域的带师。魔改一下model和loss,换个应用场景和benchmark,再加个时髦的Gan,一篇paper就呼之欲出了。
那为什么,会开始有人不看好现在的CV方向了呢?
个人认为,CV在科研领域依然在如火如荼的发展,但是在工业界,遇到了AI领域通病:落地难,不挣钱。CV领域的落地,我随便列举几个:
1、无人车
2、AR VR
3、内容理解
4、传统领域赋能(教育,安防,医疗。。。)
无人车领域是最重CV的方向,集结了大量CV人才。比如LZ提到CV的目标检测,就是无人车领域很实用的一个方向。然而,无人车还在发展初期,已经倒了很多,剩下的勒紧裤腰带,不可能招募太多人,要也是要的能突破关键技术的大牛,如果你不是赫赫有名的名校实验室学生,很难在竞争中脱颖而出。
AR, VR,和无人车一样,同样是在早期。同样的CV目标检测,可以去支持抖音上面各种时髦的特效……但然后呢?就算性能提升一倍,对这个商业模式、应用场景的影响也是有限,不能像广告、推荐能给公司带来直接量化的收益。公司需要考虑性价比,对抖音这样大公司尚且如此,小公司可能就直接上商汤API了,都不需要招CV的人。
内容理解,国外在这一块投入很大,但国内情况或许不一样。据说国内的每一条内容都有人工审核,人力便宜,直接上“真人工”智能了……
其他传统领域(教育,安防,医疗。。。),个人觉得核心价值是领域知识,政府关系,商业资源。。。CV技术?那只是锦上添花,讲一个好的故事提升估值。技术模型的提升?销售表示还不是靠他的嘴才有用。
综上所述,我并不是看衰CV,只是对想要跟风的CV新人提个醒,而真正的有志者并不会因此而被劝退。身为CV从业者,我依然相信这是一个很棒很有想象空间的好方向,一起共勉吧!
============================================
作者:匿名用户
链接:https://www.zhihu.com/question/383486199/answer/1152839921
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
混毕业是个好方向,因为很多工业界的问题用CV去刷刷过拟合,比如检测水泥裂缝这种很不CS的方向,基本是降维打击传统的方法,灌点无关痛痒的SCI/EI还是没问题的。但是这种混过来的成绩,最好就不要去找CV方向的工作了,容易被吊打。业余时间灌点水混毕业,平时好好刷C++/Java和Leetcode, 毕业以后找开发方向的工作,是我最推荐的转行过来的人走的道路,也是学历有硬伤(双非)最容易走的路。
正经一点:
CV方向有很多没有解决的问题,coco的准确度上不去了就是一个典型的例子。要把准确度从50提到70,80,甚至到imagenet的水平,需要的可能是基础理论上的突破,而不是在网络上修修改改。但是研究者的能力是有限的,在CV方向的入门门槛被拉到初中生就能入门,github上拖个模型下来调调参就能获得很好成绩的现阶段,一个研究者要想从广大的调包侠基数中脱颖而出是很难的。很有可能到最后三年研究生毕业,才发现在洪水般泛滥的"CV从业者”中自己根本没有优势可言。
另外,CV的落地场景也很有限,虽然无人驾驶,人脸识别,工业机器人,医学图像检测等方向看似很广大,实际上近年来车企一蹶不振,无人驾驶这条路根本不好走。人脸识别已经快成为被解决的问题了,都已经大规模落地了。工业机器人和医学图像检测这种,也还处于造梦阶段,商业化还远着,工业界根本没有多少岗位。
总而言之,CV在现在处于门槛低,从业人数多,职业少的一个尴尬的位置,一边是大量的学生涌入,一边是不景气的经济环境和日益饱满的就业岗位。如果你的目标是就业而不是研究,那么我建议打好开发的地基,和一些项目代码加起来没到过1万行的所谓CV从业者划清界限。
===================================
作者:宝珠道人
链接:https://www.zhihu.com/question/383486199/answer/1190760008
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
首先说观点:长期来看,我看好CV方向。
我部分理解现阶段不看好CV的论调,并从我的角度尝试解释下为什么会有这个论调。
一、首先说为什么部分理解这个论调:
1. 做CV的门槛低,科研工作相对好做。有一块GPU就能做不少事,论文也相对好发,学术界和产业界从事CV相关科研的人口基数大且呈快速增长态势(特别是学术界),造成每年培养的研究生数量增长很快,就业岗位开始“僧多粥少”了。
2. 前些年人工智能(以CV为代表)的泡沫吹得太大了。不可否认人工智能实打实带来了技术和应用提升,但资本界和产业界特别是非计算机专业的人把牛皮吹太大了。前几年钱好拿时,大家自然快糙猛上,从去年开始进入冷静期了,又遇上今年的疫情,CV需求短期内下滑的阵痛难以避免。
3. CV在产业界虽然能够提升应用精度,但多体现为“锦上添花”而非“至关重要”。这也是为什么旷视、商汤等CV龙头企业在产业界一直不温不火的原因。还有待技术的进一步突破来打开产业应用的天花板。
二、再说为什么长期看好:
1. 人类超过80%的信息是从视觉系统接收的。试想一下,人若都是看不见的,社会生活中有多少现在能做的事情都变成做不了的。李飞飞教授在cs231n课程中也提到,人类区别于其它生物,能够进化到更高阶的一个重要原因是人类发展出了视觉系统。从这套进化逻辑来看,现在CV在社会生活中没有这么重要的地位,主要是现在的分析技术没有达到,而不是CV不重要。随着社会发展,技术终究会进步,CV的重要性不断提升是必然。
2. 科技从技术突破到广泛落地应用有其时间周期。最近十年,基于监督学习的深度学习技术在视觉目标检测上已经算取得突破性进展了,回看一下十年前的目标检测技术就会发现。现在这些技术,也已经能够实打实的提升部分医疗影像处理、人脸、工业视觉相关的应用,但从全面改变这些领域的应用范式的角度来看,还有相对较长的路要走,毕竟技术只是一个方面。此外,近年来半监督/非监督的深度学习技术也在快速发展,这些技术取得突破后,也会为技术的广泛落地应用打开更多扇窗口。总的来说,利用CV技术改变社会生活,是一个不可逆转的方向。
三、最后再提一点对CV方向新入行人的建议:
1. 学得更深入一点。不要只做调参侠,这个门槛真不高。现成的数据,现成的框架,跑个好的性能出来,真的不难也不构成核心竞争力。大家要扎实把基础打好,你会手写卷积等基本运算吗?你能把大网络的梯度传导计算一步步推出来吗?
2. 不要只想着深度学习,把图像处理及相关的基本功底打好。深度学习是一种效果相对有保障的方法,但是,它对数据和计算资源的要求比较高。社会生活中方方面面都存在不少可以通过CV技术改善的地方。首先好好分析具体问题,若是可以通过相对简单的方法解决,部署起来既稳定又便宜,为什么一定要上深度学习呢。