科普:人工智能完全取代人类工作需要达到什么等级?
针对不同的应用场景,现在业界所掌握的人工智能技术的实际应用水平高低也各不相同。在选择划分人工智能水平的标准上,国际著名的人工智能专家Sandeep Rajani教授,在《人工智能:人或机器》(Artificial Intelligence-Man or Machine)一文中,将人工智能的水平和人类能力进行横向对比,划分成四个不同的等级:
- 巅峰级——已经实现了无法超越的最优能力
- 超越人类级——比所有人类的能力都要强
- 强人类级——比大多数人类的能力要强
- 弱人类级——比大多数人类的能力要弱
在介绍计算机算法和数据挖掘技术的教科书《智能Web算法》(第二版)中,达观数据CEO陈运文将Rajani教授的上述划分方法作了翻译和介绍,这里再做一些展开阐述。在当今时代背景下,现有各个不同应用领域里人工智能技术的水平高低情况和已经达成的水平如下:
巅峰级水平:
在一些规则完备、策略空间较小的应用场景下,例如在19*19的棋盘里下五子棋,如今的计算机技术已经可以穷举所有可能的对弈情况,确保与人类在任意对弈的情况下都可以实现最优的方案。同样在Tic-Tac-Toe(一种简单的井字棋游戏)、跳棋等领域,以及数据统计等工程应用方面计算机已经是巅峰级水平了。
超越人类级:
AlphaGo和柯洁的围棋对战,以及IBM深蓝(DeepBlue)战胜国际象棋冠军卡斯帕罗夫,都展示了在这些复杂的棋类游戏上人工智能已经达到了超越人类级。在一些具体的应用领域,如指纹识别、虹膜识别等领域,技术也已经非常成熟,同样实现了超越人类的能力。
强人类级:
有些智力活动需要深入的领域经验,计算机相比少量的专业人士能力还有差距,但是比一般大众的能力要强。例如在德州扑克、桥牌等领域,计算机已经强过大部分普通人类了,在一些专用领域,例如在良好条件的人脸识别(没有不良的遮挡、光照、角度问题)、良好条件的语音识别(没有特殊地域口音、复杂环境噪声)等领域里,花卉植物种类的识别等领域,计算机的能力也已经达到了强人类级。
弱人类级:
有很多技能大多数普通人类掌握起来并不难,例如驾驶汽车,但是对计算机系统来说,因为要采集的信号以及分析的数据情况非常复杂,目前还难以达到普通人类的水平,处于弱人类级。常见的还包括写作文章、阅读理解、人类语言翻译等领域。
上述介绍里,人工智能的水平从弱人类级到巅峰级水平高低各不相同。之所以人工智能在不同领域的发展水平不一致,主要是受三个因素影响,具体包括:
因素1 规则和评价方法的明确程度
越是简单明确、并且计算机可以量化评估的问题,通过人工智能来实现的代价越小,例如棋牌类游戏,计算机可以发挥的作用很大。
不确定因素越多的问题,计算机学习时就会碰到很多的麻烦。例如驾驶车辆,驾驶方法和路况变化很多,并没有非常严格而明确的“胜/负”、“好/坏”的驾驶方式;又例如麻将或扑克,有很多随机性因素,甚至有运气成分,处理条件并不严格一致,此时也会给人工智能更好的处理带来挑战。
因此,规则越明确、评判好坏的标准越客观的应用场景,目前人工智能技术的实践效果越好。而规则比较模糊的领域,日常生活中常用的那些人类的思维和解决方式会有更好的效果。
因素2 特殊情况出现频率的高低
很多应用问题,在典型场景下的处理和在包含各种特殊异常情况下处理,其难度差异非常大。
以人脸识别问题为例,在人脸拍摄条件良好、角度对正且无遮挡的情况下,现有机器学习技术完成人脸检测、识别的精度已经非常高。但是在实际应用时,会遇到相当多特殊情况,例如由于受到光照、角度等客观因素的影响,加上被拍摄者存在化妆、佩戴饰品、局部遮挡、年龄变化等各种情况,甚至少量情况下还存在被拍摄者试图通过整容或伪装方式,故意干扰计算机的识别过程,这些因素都会非常严重的影响实际使用的效果。
自动驾驶技术也同样存在大量的问题,例如正常晴好天气,和雨雪等恶劣天气,对解决问题来说难度的差别非常大。各种各样的路况情况,也对自动驾驶的实用化带来很大的挑战。
现有的大量人工智能应用,在实验室条件下很多已经达到了非常好的成绩,但是在工业化应用中,由于使用条件比实验室环境要复杂和恶劣的多,需要处理各种异常和干扰因素,因此很多应用的实际水平,还徘徊在强人类级和弱人类级之间。
目前人工智能的技术,从实验室走向实际应用,需要克服的问题很多,还有很长的路要走。在实际落地的时候,务实的做法是先限制具体的场景,尽量排除掉不确定性因素,简化问题。例如在自动驾驶技术的研发中,如果限制为固定线路之间、或者封闭道路内的应用,技术难度就会大大简化,此时往往就能从弱人类级往上提升1-2个级别,达到实际可用的程度。在文字阅读理解时,如果限制文本的行业、类型和理解内容时,也能大大的提升系统的准确率,达到可以实用化的地步。
当然,从“不确定性”的角度来说,机器也有优势。因为人的精力有限,长时间专注一件工作会导致判断准确度的下降,工作质量无法长时间保持,但机器则没有这个问题。机器在长时间、高压力的工作环境下仍能保持稳定的运行,不会感到“疲劳”,也不会受到情绪的影响。在这种情形下,人工的工作质量反而会出现“不确定性”,而机器的输出却是相对“确定”的。
因素3 积累的训练数据的规模
我们都知道,“大数据 算法模型=人工智能”,由此不难看出,人工智能的关键性的基础是大数据。俗话说,巧妇难为无米之炊,只有积累了海量的训练数据,才能将人工智能的水平向上提升。AlphaGo也是通过积累了数千万盘围棋对战棋谱数据,并进行充分的模型训练后,才打败了人类顶尖棋手的。
现实领域里,很多训练数据的积累工作才刚刚开始。尤其是监督式学习所需要的“标注数据(Labeled Data)”的积累,往往需要大量的人工参与,成本很高,大大制约了人工智能在相关领域里水平的提升。另外有一些领域的数据因为受到一些政策因素的限制,例如医疗数据,或者有些数据被部分行业企业垄断,这些都导致数据难以流通,人工智能的水平提升也就比较缓慢。
随着近年来计算机硬件存储成本的迅速降低,云计算的逐步普及,数据积累工作的硬件环境迅速改善。数据采集的意识也逐步觉醒,希望在应用需求的推动下,有越来越多的数据被数字化,并记录下来,训练出优秀的算法模型来提升效果。
从弱人类级起步,到强人类级、超越人类级、巅峰级,任重道远。科学发展的脚步通常都是先易后难、化繁为简。随着技术不断的积累与进步,相信未来在越来越多的应用领域里,人工智能技术都能代替人类,来完成越来越多有价值的工作。
陈运文,达观数据创始人兼CEO,复旦大学计算机专业博士,上海市计算机学会多媒体分会副会长,国际计算机学会(ACM)和国际电子电器工程师学会(IEEE)高级会员。曾任盛大文学首席数据官,腾讯文学高级总监、数据中心负责人,百度核心技术研发工程师,多次代表中国参加ACM等国际数据挖掘竞赛并获冠。
求报道、意见反馈、调戏 小秘书 “老雅痞” 请加微信: xinyapi
微信扫描下面二维码,关注 加速会微信公号,成长快人一步!
如果你在创业, 想认识更多的创始人,彼此学习、资源共享 ,请扫描下面二维码加入 : 创始人通讯社群 !
如果你在职场,想 认识更多媒体圈朋友(编辑/记者、市场、公关、媒介、品牌) 请扫描下面二维码加入: 媒体圈通讯社群 !