远观近看阿里云ET平台 如何开启AI落地新风潮
今年双十一阿里总销售额达到了破纪录的2135.5亿,但对阿里和整个行业来说,影响更为深远的是阿里集团层面的架构调整,在阿里巴巴集团首席执行官张勇(逍遥子)亲自签发的全员公开信中,着墨最多的两处,一为天猫,一为阿里云,业界人士看来,这两处恰恰代表了阿里的现在与未来。
阿里云机器智能首席科学家闵万里(山景)
阿里云更是被摆在首要位置,阿里云事业群升级为阿里云智能事业群,代表着云计算与AI等技术的融合。实际上,阿里云在架构升级之前已经在内部孵化了强大的AI平台能力——ET平台,ET平台于2017年12月由阿里云机器智能首席科学家闵万里(山景)正式公布。
雷锋网 (公众号:雷锋网) 分别采访到了山景、以及阿里云ET城市大脑算法专家余亮,阿里云ET工业大脑算法专家杨斌,由近及远,从内而外,阿里云将如何贯彻云上AI战略。
数学链接数据
数据是数字时代的石油,山景却有另外一番理解,他表示,数据不像原油奇货可居,数据是不断大量产生的,数据的价值如果得不到快速释放,价值密度则不断降低,只要是数据密集的地方就有ET大脑,就有AI,就有大数据的机会。
2013年山景加入阿里云,同时带来的还有两篇含金量不低的论文,这两篇文章解决了复杂网络下随机过程的大样本理论,认知反演则解决了在一个具体拓扑网络上寻优的问题。
在他看来,交通、工业等产业领域的问题,归根结底都是一个拓扑网络问题:城市交通是车流的网络,工业是流程的网络(流程型制造是一条流水线、离散型制造则是一个更复杂的网络),航空是人流、飞机的网络……要解决这些产业的问题,其实解决的都是拓扑网络问题。
“On linear processes with dependent innovations”, Stochastic Processes and their Applications, Volume 115, Issue 6, June 2005, Pages 939–958;
“On Canonical Correlation Analysis of multivariate time series”, Statistica Sinica 15 (2005), 303-323
雷锋网观察了不同类型厂商在不同领域的所谓“大脑”,是否有厂商“旧瓶装新酒”营造概念行旧事?答案是肯定的,有一定比例的厂商并无新意的拼凑起一个“大脑”,与这类厂商截然相反的是——阿里云的ET大脑的人工智能回归到本质,建立在数学理论基础之上。
“一张网”是阿里云完全自研的核心技术,也是ET大脑解决产业问题的关键所在。实际应用中的拓扑网络类似于互联网式的分布式结构,在网中不断流动的是数据,数据来源多种多样,不同时空、不同结构,甚至不知真假,ET大脑纳入多种融合数据,形成可复用的场景输出能力,而此前大多平台数据孤立不流动,且需要苛刻的数据“饲喂”才能输出相对精准的判断。
ET大脑的四个关键词——认知、判断、决策、学习。多维感知数据,分析并实时决策,形成全局性可执行洞察(actionable insight),兼具持续进化的学习能力,ET大脑的核心也在此。
“我们有了网络,有了动态的物流、业务流的时候,就有了动态的数据流,如果把数据流抽象出来,我们可以发现最终回归到人工智能原点——人脑”,或许这也是各式各样的AI平台统称为大脑的缘由。
2007年山景就曾应用该理论研究新加坡的智慧城市交通管理,开发的预测算法对新加坡CBD区域不同等级的地面道路进行预测,准确率超过85%,其也是业界第一个能准确预测未来路况的实战系统。通过表象数据的信号、关键统计量及一系列算法找到数据特征,寻找到拓扑网络上的量化关系,进而找到控制窍门,山景的理论研究是基础,但阿里云在其上做了更多的研究。
算法、算力和数据是人工智能的三要素,同时也是ET大脑的三要素,不得不说云计算的大规模发展解决了ET大脑需要的算力资源,才有了ET大脑在各行各业开花结果,ET大脑与各个领域行业大脑是总分关系,根本性区别就在于加入行业知识,专攻行业场景。
ET大脑的发展有不少值得铭记的瞬间,山景提到了两个案例,其一是阿里云顺利将浙江高速历史数据、实时数据与路网状况结合,基于阿里云大数据平台,预测未来一小时内的路况,其二则是阿里云在工业领域不断重复尝试,终于觅得一缕成功曙光,雷锋网本次也采访到了两位专家。
城市大脑闭环
雷锋网获悉,杭州城市大脑2.0覆盖420平方公里,杭州主城限行区域全部接入大脑,此外还有余杭区临平、未来科技城两个试点区域及萧山城区,总计420平方公里,相当于65个西湖。优化信号灯路口1300个,覆盖杭州四分之一路口,同时还接入了视频4500路,可以实时指挥200名交警。
城市大脑是阿里云ET大脑最先落地的场景,这其中既需要解决模式的问题,又需要解决技术的问题。阿里云城市大脑以云的方式输出,其中有专有云、公有云、混合云,政府需要相当大体量的软硬件综合技术平台,软件是阿里云的对外接口,在硬件部署能力阿里云也在了大量工作,以云形式输出城市大脑也是阿里云有别于其他公司的特点之一。
阿里云ET城市大脑算法专家余亮介绍,阿里云在城市大脑中主要解决两个问题:
-
数据问题:在城市大脑中,数据有很多特点,像数据本身的异构性、实施性,海量数据的特征,需要一整套大数据的管理平台。阿里云从硬件、软件到设计服务拥有深厚积累,阿里云目前能够把城市所有相关部门的海量数据,特别是视频数据,每天收集并实时分析。
-
弹性计算问题:支撑起一个城市计算平台必然需要消耗相当大的资源,尤其是视频计算,云服务从根本上解决了规划、采购和管理问题。
但实际上,阿里云是互联网公司,相对于传统交通行业是“门外汉”。余亮表示,交通工程有自身的一套数据模型和理论,但交通领域的数据模型可能聚焦于局部,在一定区域内流量如何建模,参数如何调优。而阿里云是以网络的视角看数据科学,包括时空特性、网络节点数量和关系等等。
基于山景最初提出的运用互联网数据做单点信号的优化,阿里云算法团队在后期加入了更多的数据科学知识,各种预测、优化。阿里云目的不是解决一个点或者是一片主干道的交通问题,而是把几百个信号灯当做一个整体来进行优化,在世界范围内都是第一个。
目前阿里云城市大脑横向复制和纵向深化并重而行,第一要务仍然是在国内已有的项目中向各个行业提供基础服务设施,纵向深挖提供端到端能力,阿里云希望做出城市大脑中的超级应用。在全球领域的横向复制中,阿里云已经将城市大脑复制到马来西亚等地区,交通问题是普遍性难题,阿里云有很大的潜在市场。
余亮也坦言,在技术领域城市大脑仍在不断进化,技术和应用结合发展,比如大规模信号灯调控方案的进一步优化,认知反演如何寻找关键节点、网络分隔,包括流程、算法的协调上有一些创新。
“我们的工作都是比较落地的,阿里云在开发一个仿真引擎,能够对交通状态进行实时仿真,仿真的速度满足所需交互性。过去的仿真时间比较长,数据标定需要非常多的时间,仿真的结果也不能实时进行交互式调整”,余亮介绍。
在仿真引擎之上,算法可以基于此做测试,然后不断改进。仿真、优化、再迭代,虽然仿真引擎不能给阿里云带来短期现实收益,但阿里云内部认为这是城市大脑非常重要的部分,在理论层面形成城市大脑的严密闭环。
开辟工业数据智能
“我们对于工业一直心存敬畏之情,工业是国之重器,影响国计民生,工业细分行业又是如此繁杂,行业know-how深不可测”,阿里云ET工业大脑算法专家杨斌如是表示,笔者很难想象阿里云ET工业大脑开拓的艰难程度,不过据山景回忆,工业大脑甚至一度要放弃。
杨斌表示,ET工业大脑第一个项目始于2016年,标志着ET工业大脑开始进入探索行业性大数据解决方案和价值输出的开始。针对工业企业客户的要求,产品和解决方案输出必须要能够提供给行业客户应用场景的指导,而不是像常规的互联网干预,或者有所谓的工业互联网数据连接和平台连接
“对于阿里云来说,我们是对自身数据智能的技术,云计算、大数据、AI算法等等这方面是我们的信心所在。但是,深入到工业行业里面,对工业数据的分析、探索,以及对这个工业细分行业它的每一块细分行业的特殊性,然后业务的理解性,这都是很大的挑战”,杨斌提到。实际上这也是当下所有工业互联网领域厂商所面临的共性难题。
杨斌补充道,“甚至在这个过程中,并没有一个系统说明让我们知道在工业的工研产销的各个工作流里面是有哪些数据的。我们的算法专家面临着从0到1的难题,阿里云算法专家直接深入工厂场景,通过和具体生产部门、工艺部门、信息部门做交流,在对数据的理解达到一定程度之后,再结合阿里云自身云计算、大数据、人工智能算法找到突破口”,
工业大脑本身属于平台级产品,包含数据工厂、算法工厂、AI创造间,支撑行业客户去完成工业企业的数据算法以及开发治理,最终生产出给企业量身定做的数据智能服务。ET工业大脑沉淀很长一段时间才推出,但在推出之前已经有过若干年的实践,基于项目的交付、实施和业务价值提升,最终成型数据工厂、算法工厂、AI创造间的架构体系。
数据工厂主要解决客户数据安全、有效、稳定上云的过程,同时在数据平台进行质量管控和治理;算法工厂基于阿里云过去历史项目的积累、实践,沉淀了工业大脑的算法引擎,算法引擎可以根据用户需求再开发,基于该平台,工业客户不需要自己重新再经历算法工程化过程;在AI创造间里,客户通过拖拉拽的方式,把数据模块、算法模块,变成工作流业务的编排,形成一个工作流的业务输出,对外发布服务,可以调试出量身作定做的数据智能应用服务。
“我们希望通过工业大脑降低行业AI使用门槛,通过可配置的方式做业务的编排。但这个平台本身也是一个开发型的平台,合作伙伴或者工业终端客户自身信息部门的开发人员可以进行行业模板构结、定制,在平台之上沉淀自身的行业数据模型,架构自己的算法模型,进而形成一个生态”
工业领域的自动化程度不一而足,如何兼容并包是一个现实问题。杨斌表示,阿里云ET工业大脑和工业企业原有系统、平台、软件根本不存在相互竞争关系,很大程度上阿里云更多的是通过自身能力普惠工业行业,为企业降本增效、数字化转型提供全链路、全数据、全流程的数据智能输出。
内外审视ET大脑
人工智能基于数学建模,总体来说,我们所能落地应用的人工智能都还比较初级,无非逃不过语音、图像和自然语言处理等数样,而随着行业的的发展,技术的制约越发凸显,“深度学习寒冬论”“AI骗局”等等被揭开AI浮华表象,逐渐让业界认识到一个朴素的现实——人工智能的发展还处于初级阶段。
人工智能不“智能”,相反地,它还需要大量的“人工”。一个得到大多从业人士认可的理论是,人工智能的发展要经历运算智能、感知智能、认知智能三个阶段,后边是否还会有更深层次的发展还不明确。目前我们所处的时间点大概是从感知智能向认知智能发展,人工智能已经能够成熟的感知语音和图像等信息,认知智能即意味着人工智能“能理解会思考”。
在雷锋网看来,人工智能的发展目前还处于模仿人脑的阶段,ET大脑是阿里云多技术、多模态融合的典型输出产品,而阿里云仍在强化ET大脑的极限。
对内,在日前的架构调整中,阿里巴巴集团首席技术官(CTO)张建锋(行癫)将兼任阿里云智能事业群总裁,特别需要注意的是,逍遥子在信中写道, 集团过去几年在实施中台战略过程中构建的智能化能力,包括机器智能的计算平台、算法能力、数据库、基础技术架构平台、调度平台等核心能力,将全面和阿里云相结合 ,向全社会开放,为全社会服务。
对外,阿里喊出了产业AI的口号,阿里云智能事业群几乎聚齐了阿里集团面向2B市场的大部分要素,时任阿里云总裁胡晓明谈及阿里云对产业的思考,“过去每一次产业革命,都是技术与产业的深度融合,从而引发经济和社会变革,AI也不例外。未来AI要深入各行各业,去解决生活、生产和社会环境中遇到的棘手问题,这样才能引领真正的产业革命”。阿里云的AI侧立于行业旁,融入于行业中。
阿里云智能平台是阿里巴巴集团中台战略的延伸和发展,云计算+AI,这并不是新鲜搭配,但更多时候云计算只作为一个底座。这反映出阿里云又一个超前思考,在阿里云计算业务率先成熟的前提下,抛开云计算行业的同僚,加速在人工智能赛道上狂奔,阿里向伟大公司招手。
阿里云提前鸣响了下一场比赛的发令枪,下一场,关乎人工智能与未来。
相关文章:
阿里云机器智能首席科学家闵万里:共建万物智联时代
阿里云IoT田辉:从IoT维度思考智慧城市构建 | AIoT+智慧城市峰会
阿里CEO逍遥子亲自宣布阿里云大变动:胡晓明卸任,新成立阿里云智能事业群,张建锋兼任总裁
。