疫情过后,走出寒冬后的人工智能何去何从
千万不要浪费一场危机。
——丘吉尔
疫情期间,杭州的城市大脑,健康码、阿里全基因测序、CT影像等在疫情期间充分展示了中国以人工智能等为新基建的中国城市治理能力。
正在热议的两会, 确定以新型基础设施建设为中心 ,以新发展理念为引领,以技术创新为驱动, 全面发展5G、人工智能等新型技术,加速产业化的落地。
本文主要从目前人工智能领域存在的问题简要推演下,走出寒冬后的人工智能何去何从。
一、人工智能的生产原料(数据)遇到了什么问题
数据层应用现状:
(1)存不下——数字化浪潮下的海量数据存储挑战
数据量的急剧上增是数据存不下的重要原因,目前据全球统计企业的数据量从PB级向EB级迈进,数据量将从2018年的32.5ZB快速增长到2025年的180ZB。
由于存储系统仍为传统架构以及成本等原因,当前企业数据仅有不到2%被保存,数据“存不下”的问题日益严重。
- 存储扩展性不足: 传统存储由独立的控制器与硬盘框组成,当容量不足时可增加新的硬盘框进行级联,但由于控制器的处理能力受限,存储的扩展能力非常有限。
- 存储协议类型单一: 非结构化数据逐步成为企业数据的主体。随着电商、物联网等业务扩张,80%的新增数据由各类音视频、日志等非结构化数据构成。然而传统存储协议类型单一,无法同时满足块、对象、文件、大数据等多样性数据的存取需求,企业不得不为每一种新的数据类型新增一种存储设备,增加了高效利用存储资源的难度。
- 存储成本依然高昂: 越来越多的企业选择将数据长期保存。2017年起,移动运营商因合规性要求,将其设备日志的保存周期从2个月增加至6个月。
这意味着其数据存储服务器的设备规模将增加至少2倍。传统的架构中,服务器因存储需求不断扩容,但CPU的使用率却始终处于较低的状态,资源得不到合理利用,无疑会对采购成本和维护成本造成更大的压力。企业不得不因为存储成本而放弃大量宝贵数据。
(2)流不动——由来已久的数据孤岛难题
孤立的数据价值并不显著,只有当数据像水一样流动起来,才能打破“数据壁垒”,最大化释放其价值。
数据的“三类孤岛”:
- 应用孤岛: 不同应用产生的数据分别存放在不同的存储系统中,而且这些数据由于各自的特征,彼此之间是无法共享使用的,即形成“应用孤岛”问题;
- 管理孤岛: 为对生产数据加以保护和使用,会将生产数据的一个副本,拷贝到各个系统(如备份、容灾、归档、开发测试和分析系统)中进行管理和使用。即便是同一份数据,为实现不同目的,还需分别存储、管理和使用,即形成“管理孤岛”问题;
- 地理孤岛: 由于企业的更新换代,将存在多套存储设备,比如生产环境、非生产环境、云环境和边缘环境,企业的数据将存放在不同的地方,形成“地理孤岛”问题。
(3)用不好——数据供应不足造成应用复杂低效
海量的数据孕育了前所未有的机遇,也带来了巨大的挑战。甚至有人说,从来不缺数据,数据多了反而成为一种负担。也有人说,数据只是资源,而不是资产,很难产生价值。其根本原因是没有用好数据,数据没有释放价值。而影响数据价值释放的主要原因是数据供应不足,无法反馈业务本质,支持业务决策: 大量数据未存储。
企业每天会产生大量数据,但传统的数据录入需要预先的人工规划,这导致大量非结构化数据以及一些新型的数据无法进入系统(例如IoT数据、视频数据、图片数据等)。数据的缺失会削弱对业务的感知,无法真实及时地反映出业务本质。
找不到数据传统企业通常通过数据表来管理和分析数据,规模较大的公司数据表甚至可以达到数百万张,而且分散在各个业务系统中。如果没有统一数据目录和全局数据视图,要在上百万张报表中找到特定的数据,好比大海捞针,无法应对灵活多变的业务需求。
接下来致力于数据融合,发掘数据价值,拥有数据的企业将不断重新定义人工智能行业的发展。
二、人工智能的技术及应用趋势
从技术层面,近年来取得成功的AI技术大都基于深度学习和神经网络,当前热门研究方向依然是 基于这些方法的改进以及与对抗学习或强化学习等其它思想的融合。
(1)深度学习泛化能力及可解释性进一步突破
在应用方面,这些技术已经进入了我们的日常生活,比如智能推荐、机器翻译、聊天机器人以及各种图像美化应用。
对于近期的未来,人们普遍相信深度学习还有进一步的发展空间,甚至希望彻底改变我们的生活方式,比如很多人都相信成功的自动驾驶技术将会彻底改变我们的生活出行。
同时, 由于深度学习在泛化能力以及可解释性方面的困难 ,也有人认为深度学习将难以在一些存在严格要求的领域发挥真正重要的价值,进一步的突破还需要探索更广泛的方法。
模型可解释性深度学习的模型可解释性已经成为了制约深度学习广泛应用的一大主要障碍,其在法律和伦理方面引发了些讨论和争议。可以预见这方面的技术探索和社会讨论还会继续。
深度神经网络与新思想融合Al继续进入人类的日常生活智能音箱进入家庭、人脸识别在守卫街道、机器翻译、自动驾驶汽车已经上路测试、数字助理正在学习处理越来越复杂的任务……Al应用还会继续进入更多日常生活场景并继续改变我们的生活方式。
(2)高效和低成本模型仍是研究热点
高效和低成本模型尽管目前相当多一些模型已经能够在较低成本的硬件上有效运行,但要训练出足够实用的模型,当前的深度学习方法往往需要大规模数据集和成本高昂的计算硬件。
如何设计高效的训练方法已经成为当前的一大重要研究主题。对于已经诞生的Mobile Net、Shutfte Net和Pelee Net等一些模型,其实用性仍被认为还有所欠缺。高效和低成本模型仍会继续是AI领域的一个重要未来方向。
(3)5G与AI融合是另一个发展的大趋势
在技术成熟度曲线(The Hype Cycle)中,看我们可以充分看到,5G这种基础设施铺建的技术推到了风口浪尖,从技术成熟度曲线中,我们不难看出,5G及RPA的发展成了重头戏,而对机器学习的关注度朝着下降的趋势发展。
对于某种技术来讲,技术本身的发展随着媒体的关注度会逐年下降,而维持一种技术本身的生命力来说,更多是技术+场景,也是技术本身的实用性和可复制性。
所以对于人工智能的未来,技术的融合以及技术与场景的融合成了重中之重,AI平台的建立为更多人赢得了机会,并且也让技术的快速融合成为了可能。
对于未来来说充满着各种不确定性,不过没关系顺势而为这是我们唯一可以坚信的一点,对于我们每个人来说,找到趋势,顺势而为或许这是我们唯一可做的事情。
本文由 @荆飞瑶 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议