麦肯锡:中国人工智能 直面三座大山
数据环境封闭
人才紧张
硬件技术短板
成为拦在中国AI路的
三座大山
BAT大佬在刚刚过去的IT领袖峰会上聚焦了 人工智能 。李彦宏提出:“互联网是一道开胃菜,人工智能才是主菜。”这是人工智能继两会之后又一次在国内的大声音。
随着人口红利的快速消失,中国急需寻找新的增长引擎。基于人工智能的自动化可以提升生产力,帮助中国实现其经济发展目标。人工智能领域的全球风投从2012 年的5.89亿美元猛增至2016年的50多亿美元。
本期的智能内参,我们推荐麦肯锡的中国人工智能的未来之路报告书,报告梳理了人工智能技术发展历程,并分析了该技术对于中国社会发展可能起到的作用,预测相关产业及经济政策框架。
拐点来临*人工智能不同技术领域的商业化程度
AlphaGo 成功击败人类世界围棋冠军李世石,人工智能这个科幻小说一般的概念似乎一夜之间从虚无缥缈的幻想成为了现实。
传统的软件程序由人类编写,包含具体的指令要求。人工智能的工作模式完全不同。它们依据通用的学习策略,可以读取海量的“大数据”,并从中发现规律、联系和洞见。因此人工智能能够根据新数据自动调整,而无需重设程序。
事实上, 20 世纪五六十年代,人工智能的理论就已经初步形成,但由于技术未能实现突破性进展,人工智能无法达成预期效果,因此陷入了一段沉寂期。
往后数十年间虽然不乏成功案例(如 IBM 的超级计算机“深蓝”击败国际象棋冠军加里·卡斯帕罗夫),但因为人工智能在现实世界的成功案例太过孤立,所以不足以支撑大规模商业化。
现在,我们正处于人工智能复兴浪潮,数据收集及整理 、 算法 (尤其是机器学习)以及高性能计算等技术的突飞猛进促成了革命性进步。利用机器学习,人工智能系统获得了归纳推理和决策能力,并实现了某些商业化落地,可以担当客服、管理物流、监控工厂机械、优化能源使用以及分析医学资料;而深度学习更将这一能力推向了更高的层次。
变革不仅发生在理论前沿。被视为未来超级智能系统的先锋——各类应用机器学习技术的分析工具已现身市场。金融、医疗、制造等行业应用发展迅速,人工智能领域的全球风投也从2012年的5.89亿美元猛增至2016年的50多亿美元。麦肯锡预计,至2025 年人工智能应用市场总值将达到1270亿美元。
未来,人工智能可成为应对一些社会核心挑战的强大工具。在医疗领域,人工智能将 极 大提升我们分析人类基因组和为患者开发个性化治疗方案的能力,甚至大大加快治愈癌症、阿茲海默症和其他疾病的进程。在环保领域,人工智能能够分析气候特征并大规模降低能耗,帮助人类更好地监控和应对气候变化问题。人工智能甚至可以在地球以外地区发挥作用,他日或助力人类探索火星及外太空。
麦肯锡全球研究院近期的一份报告对全球800多种职业所涵盖的2000多项工作内容进行分析后发现,全球约50%的工作内容可以通过改进现有技术实现自动化。当然,技术可行性只是影响自动化速度及程度的一个因素,还有其他因素需要考虑,包括研发和应用成本、劳动力市场供需、经济效益,以及社会和政府监管部门的接受度。
综合上述因素,麦肯锡全球研究院的这份自动化研究报告指出,在现今所有工作内容之中,过半会在2055年左右自动化,但这过程存在诸多变量,误差在20年左右。
中国已成全球AI发展中心之一学术方面,仅在2015 年,中美两国在学术期刊上发表的相关论文合计近1万份,而英国、印度、德国和日本发表的学术研究文章总和也只相当于其一半。其中,中国的人工智能发展多由科技企业推动引领,如自动化私人助理、自动驾驶汽车等。这得益于大量的搜索数据和丰富的产品线,一些互联网企业走在了自然语言处理、图像和语音识别等技术前沿。但值得注意的是,虽然中国在人工智能的论文数量方面超过了美国,但中国学者的研究影响力尚不及美国或英国同行。
*中国人工智能论文数量以及影响力
人工智能生态系统方面,美国也更为完善和活跃,创业公司数量远超中国。由研究机构、大学及私营企业共同组成的生态系统庞大、创新且多元。硅谷在科技领域日积月累的强劲实力形成了强大而难以复制的优势。
*美国的AI生态更完善和活跃
拦在中国AI路上的三座大山数据环境有待放开
*中国政府数据开放度为全球第93名
首先,尽管中国的科技巨头能够通过其专有平台获得海量数据,但在创建一个标准统一、跨平台分享的数据友好型生态系统方面,中国仍落后于美国。其次,全球各国都已意识到开放政府数据库有助于促进私营领域创新,但中国政府数据的开放度仍极为有限。最后,对跨境数据流通的限制也使得中国在全球合作中处于不利地位。
人才市场紧张
应用层面而言,中国的算法发展程度与其他国家并无太大差距。然而,中国的研究人员在基础算法研发领域仍远远落后于英美同行。一个主要原因就是人才短缺。美国半数以上的数据科学家拥有10年以上的工作经验,而在中国,超过 40%的数据科学家工作经验尚不足5年 。中国在人才方面的持续努力将至关重要。
目前,中国只有不到 30 所大学的研究实验室专注于人工智能,输出人才的数量远远无法满足人工智能企业的用人需求。此外,中国的人工智能科学家大多集中于计算机视觉和语音识别等领域,造成其他领域的人才相对匮乏。如果中国大学对学生提出更高的数学和统计学要求,并且集中资源发展该领域全球前沿研究,人工智能的发展必将受益匪浅。另一个值得思考的方向是改进现有的科研经费分配模式来推进创新。
硬件短板
高运算速度的计算技术是发展尖端人工智能技术的重中之重;特种处理器,如可以处理大量复杂计算的 GPU,对人工智能的发展格外重要。而其耗能长期以来,中国的微晶片严重依赖进口,部分类型的高端半导体则几乎完全依靠进口水平则决定着人工智能解决方案能否实现大规模商业化。
2015 年,美国政府禁止了英特尔、英伟达和 AMD这三家全球最大的芯片供应商向中国机构出售高端超级电脑芯片。这一禁令显示了中国在半导体方面的自主研发能力对于未来人工智能发展十分重要。
为应对这一局面,中国政府在 2014 年出台了《国家集成电路产业发展推进纲要》以及“中国制造 2025”行动纲领。中国政府还成立了国家集成电路产业投资基金,目前募资已超过 200 亿美元。相关行动已初见成效:2016 年 6 月神威?太湖之光超级计算机问世,成为世界上运算速度最快的超级计算机,使用的是中国自主知识产权的处理器。政府的前期投资可以产生显著的涟漪效应,鼓励私营企业的积极参与。
复杂的社会及经济问题劳动力市场需求与冲击
在过去数十年,中国因“人口红利”受益良多,劳动力的扩张大大促进了经济增长。但老龄化正使中国逐渐失去这一推动力。中国的劳动年龄人口最早将在2024 年达到峰值,并在之后的 50 年中减少五分之一。
这一人口结构变化趋势意味着在当前生产力水平的基础上,中国将缺乏足够的劳动力以维持其经济增长。拉动经济增长唯一可行的方式就是大幅推动生产力增长,如引进人工智能。麦肯锡全球研究院预测,根据应用速度的不同, 基于人工智能的自动化为中国带来的生产力提升每年可贡献0.8至1.4个百分点的经济增长。
人工智能有大幅提升生产力增长的潜力,但代价可能是收入差距的进一步拉大,包括城市发展不平衡的加剧。总而言之,人工智能将推动形成所谓的“技能偏好型科技变革”——即数字技能将特别受到重视,而对中低端技能劳动力的需求将缩小。
中国目前从事可自动化工作的劳动力人口超过其他国家。麦肯锡全球研究院预测中国 51%的工作内容有自动化潜力,这将对相当于 3.94 亿全职人力工时的冲击。但这并不意味着如今的高端工种能够完全免受冲击。比如,医生之类专业人士的部分工作也可能被自动化,而医生的工作内容将会更专注于与人的沟通和互动。
社会效益与隐忧
人工智能发展前景广阔,可用于改善医疗、环境、安全和教育,提升民生福祉。与此同时,由于它模糊了物理现实、数字和个人的界限,衍生出了复杂的伦理、法律及安全问题。随着人工智能的逐渐普及,需要审慎管理来应对这一转变。
许多现有用例展现出了人工智能解决社会问题的潜力,如环境变化预测、节能减排、 智能医疗 、数字化医疗档案、更为安全高效的交通系统、智慧城市、自动驾驶等。
然而,除了这些潜力外,管理具备自主学习和决策能力的机器也是一份重艰巨的责任。
首先:谁拥有个人数据?数据应以何种方式共享?面对日趋严峻的网络安全攻击又该如何保护数据?其次,人工智能可能在决策过程中产生无意识的歧视。由于现实世界存在着各种形式的种族歧视、性别歧视和偏见,输入算法中的数据也可能附带这些特征。而当机器学习算法学习了这些带有偏见的训练数据,也就“继承”了偏见。此外还有很多地缘政治的影响,如国家间的“数字鸿沟”,“自动化武器”风险等。
除伦理问题之外,人工智能在社会的普及更会产生诸多法律层面的影响。如果人工智能的决策导致意外甚至犯罪,谁应当对其负责?人工智能创作的知识产权归谁所有?一旦人工智能拥有超级能力,又该用哪些措施进行监管?人工智能研发人员有哪些法律权利与义务?
要建立一个完善的法律及伦理框架,仍有许多问题尚待充分探讨。
中国AI战略重点的五大预测建立完善的数据生态系统
数据是未来的货币。例如在医学研究中,如果没有全球海量临床数据的支持,人工智能的潜力就无法得到充分挖掘。过多的桎梏将会束缚中国的人工智能企业,导致其丧失开发具有全球竞争力产品的能力。
中国可以通过建立并落实数据规范、向私营领域开放公共数据、鼓励跨国数据交流来构建一个更为完善的数据生态系统。
首先, 建立 数据标准是进行广泛数据分享和实现系统间交互操作的重要前提条件,有助于提升物联网及人工智能技术的价值。潜在的庞大数据体量是中国的天然优势,使中国有机会在国际上更好地发挥领头羊的作用。而且,在与中文语言相关的数据规范制定方面,中国也应起到主导作用。
对于特定行业数据,政府可要求现有的监管机构制定必要规则。比如美国证券交易委员会在 2009 年出台规定,要求所有上市公司使用 XBRL(可扩展商业报告语言)格式发布财报,确保所有公开数据的机器可读性。
其次,为了提升数据的多样性,政府应提高公共数据的开放程度 ,并带头建设行业数据库。这些举措同时能够提升公共服务质量、提供政策制定洞见,从而带来额外益处。比如纽约市政府就建立了公开数据门户网站,为市民提供经济发展、医疗、休闲、公共服务等领域的数据。2012 年纽约市还颁布了《开放数据法案》,要求政府部门使用机器可读取的数据并建立 API(应用程序编程接口),方便软件研发人员直接连接政府系统并获取数据。
最后,中国政府还需考虑 国 际 数据流的价值。麦肯锡全球研究院的调查表明,2014 年,跨境数据流为全球经济创造了 2.8 万亿美元的价值,对经济增长的贡献已经超过实体贸易。此外,研究还指出,由于经济体需要接触全球的思想、研究、科技、人才和最佳实践案例,数据流入和流出都能十分重要 。
拓宽人工智能在传统行业的应用
第一重障碍是很多商业领袖还没有意识到改变现有业务运作方式的紧迫性。麦肯锡调查显示,目前在中国的传统行业中,超过 40%的公司仍未将人工智能列入战略优先项。因此,许多公司仍未开始采集未来人工智能系统所需要的数据。例如,农业公司鲜少记录如种植时间表或是气候对产出的影响,而这些信息正是人工智能生成洞见及提升效益所需要的。与此形成对比的是,英国、美国和日本都已建立了全国信息系统采集此类数据,将先进的分析技术引入现代农业管理。
第二重障碍是专业技术知识的缺失。中国需要培养更多的优秀数据科学家,特别是在一些需求紧迫的领域。而能将人工智能知识转化为商业应用创造价值的人才也同样紧缺。为了理解和应用数据,越来越多的企业决策者和中层管理者需要学习新技能。与英特尔类似,一家中国芯片制造商已经意识到,分析在制造和测试过程中的大量数据将有助于改进生产流程并降低残次率。但由于缺乏既懂半导体技术,又懂人工智能的人才,这一想法仍然没能被付诸实施。
第三重障碍是实施成本较高。对中国企业而言,购买人工智能系统、高价聘用专业人才有时并不合算。当人工成本较低时,引入先进技术、精简人工流程的需求也并不那么迫切。
减税和补助等传统经济工具可以解决一些问题。同时,政府还应率先垂范应用人工智能系统。这将产生强有力的跟随效应,激活市场,助力服务供应商的发展,积累技术经验和人才,最终达到降低应用成本的目的。
此外,鼓励物联网(简称“IoT”)在传统行业的应用将有助于人工智能产生更多的价值。物联网通过传感器和网络实现各类设备间的联通,为人工智能提供了海量的真实世界数据。结合“互联网+”政策,政府可协助打造物联网在关键经济领域应用的成功案例,为其他行业树立典范。
加强人工智能专业人才储备
中国面临着巨大的人工智能人才缺口。政府需要大力投资人工智能相关教育和研究项目;重新设计教育体系,突出创新和数字技术的重要性;制定吸引全球顶尖人才的移民政策。
政府可出资设立人工智能项目,资助顶尖大学创建人工智能研究实验室和创新中心,以推进大学、科研机构和私营企业间的合作。在这方面,韩国政府已经迈出坚实的一步,投资 1 万亿韩元(约合 8.63 亿美元)与韩国商业巨头合资建立国家级的公私合营人工智能研究中心。加拿大政府也有类似举措:政府向蒙特利尔三所大学的人工智能研究项目投资超过 2 亿美元。
许多受访专家表示,中国必须花大力气培养更为广泛的创新文化,方可实现人工智能领域的突破。途径之一就是引入将人工智能和其他学科相结合的大学课程。斯坦福和麻省理工等顶尖美国高等院校已经开设了计算机科学与人文学科的联合专业,旨在寻求激发创造力的新方法。此类课程能够激发人工智能在医疗、法律、金融和媒体等各领域的应用。
投资大学项目可带来长期收益,因为人才是未来吸引国际公司的核心所在,而非传统的税收或其他财务优惠。人工智能的大型研发团队对吸引学术人才愈发重视。 谷歌 DeepMind 团队中有大约三分之二的成员来自如伦敦大学学院、牛津大学和蒙特利尔大学等学术机构。这一领域顶尖公司自然而然会向拥有大量人工智能人才的城市汇聚。例如,随着蒙特利尔在该领域的声名鹊起,谷歌和微软都宣布了将向当地大学人工智能研究所投资并拓宽公司在当地的业务。
除了培养国内人才,中国也需要与全球顶尖数据科学家合作,参与到国际协作之中,包括大力引进国际专家来华工作、鼓励中国人工智能研究者出国学习全球最新的创新科技。这些要求政府放松居住和移民政策,并出台奖励和支持措施。
教育和培训体系升级与再培训
人工智能在经济和社会中的普遍应用还需要数十年,但中国现在就应为一些行业的快速颠覆做好准备。某种关键技术的突破短短几年就可以让一些职业消失。
未来的一项长久挑战是帮助受到人工智能冲击的行业劳动力重新适应并获得新技能,这将是保障公共福利和维护社会稳定的关键。政府要及时识别哪些是最可能被自动化取代的工作,并为受到影响的劳动力提供再培训,比如与职业培训学校紧密合作,向工人提供免费教育的机会。
与此同时,政府也应着力加强数据和人工智能在各个阶层的教育。未来的政府领导必须理解人工智能才能制定明智的政策,未来的管理人员必须了解人工智能才能管理企业;未来的工人必须学会与人工智能共事才能避免被淘汰。
在国内及国际上建立伦理和法律共识
人工智能的进步将在多个方面为社会带来深远的影响。在最为紧迫的伦理和法律问题上,中国不仅要在本国,更要在国际上促成共识。
在国内,应形成一套 透明 和广 泛 的 质询 程 序来确保公众做好迎接变革的准备。一些法律问题,比如隐私保护和自动驾驶汽车的责任认定等,将对人工智能的发展及应用有着举足轻重的影响。全国人大需要建立起法律框架,扫清法律上的不确定性。
待法律框架建立之后,政府就要成立监管机构负责人工智能的监督和管理。考虑到人工智能在各行各业的广泛应用,这就要求政府与各相关机构协商咨询、发挥其专长。比如,医疗领域的应用不当将造成严重后果。因此,国家卫生和计划生育委员会必须在规则制定过程中拥有强有力的话语权。
在国际方面,中国可以牵头组建国际性的监管机构以促进人工智能技术的和平、全面和可持续发展。该国际机构的目标应是监管人工智能的发展、制定标准和确定伦理准则。
除了监管,中国还可以在全球经济发展中起到模范作用。为保证全球数字鸿沟不会成为经济繁荣的长期阻碍,中国可与其他发展中国家分享和交流人工智能技术及管理经验,从而揭开“人工智能一带一路”新篇章。
我们的人口结构、产业结构和生产力发展现状决定了人工智能的应用发展大势,但如文所属,数据环境、人才紧缺和 智能硬件 ,特别是微晶片、CPU等产业的不成熟,可以说是中国人工智能发展面临的最大难题,很难在短期完善的解决;此外,技术方面,我国论文数量并不能弥补论文质量的不足,在很多基础层的关键领域有待提高,这对于大数据红利之后的后深度学习时代而言非常重要。