华为AI首席科学家裴健:企业所面临的AI挑战
都说人工智能的大潮已经到来,但是人工智能应该如何落地与产业结合,产生实际的效果?在ACM SIGKDD主席、加拿大西蒙弗雷泽大学计算科学学院教授裴健看来,产业AI化的核心是数据以及对于数据的挖掘,而对于企业来说,AI落地的过程中最关键的不是你用了多少新鲜的算法和新的数据,而是你能不能直接支撑业务部门进行业务手段和业务内容的创新。
在过去的数年中,裴健教授一直在与蓝十字、SAP、IBM、华为等多家公司进行着大数据方面的合作,对如何推进企业AI进程也有着深入的研究。2017年正值裴健教授的学术间隔年(Sabbatical Leave,欧美教授每隔数年可以有一年时间不承担学校的教学工作,专心去做自己想做的研究与课题),而裴健教授曾向雷锋网 (公众号:雷锋网) 提过,他希望能更好参与到一个用AI推进企业流程的完整过程中,因此裴健教授与华为展开了更全面的的深入合作并担任华为AI首席科学家一职,帮助华为更好地将AI与其业务结合起来。
AI与传统产业结合有两种思路:AI+和+AI。前者先打造一个AI平台,在平台上跑各种AI的应用,并将传统产业转到AI平台上运行;后者则是在某些比较适合AI应用的领域先研究如何应用AI,用AI改进流程,并将其逐步推广到其他传统产业中来。裴健教授向雷锋网介绍,“+AI”的思路在华为内部供应链、风险控制、热线客服等业务领域已经得到了明显的业务进展,华为在此基础上提供了一系列端到端的解决方案,将供应商包含其中,以AI的方式来解决传统企业的业务问题。
在正在召开的“华为全联接2017大会”上,裴健教授结合华为云的业务,为我们进一步介绍了企业在做AI应用中的难点与挑战。裴健教授认为,AI只有使得业务产生价值,才能够最终对用户有真正的作用 。
(裴健教授演讲中)
以下是雷锋网整理的裴健教授演讲主要内容。
我非常高兴有机会能够跟大家分享华为在公有云上提供的AI服务,以及这些服务怎么能够帮助我们的企业迎接未来的挑战。
我们都知道在最近的几年里面AI取得了前所未有的重大突破,产生了很多明星级的应用。为什么AI这个已经存在了几十年的学科在最近的几年会取得很大的突破?其中有两个很关键的因素,第一个是在机器学习领域,我们有了一些开源的机器学习库,如说Tensorflow、MXNet、Caffe、CNTK等,使得用户可以很容易地编写机器学习模型。但是编写了一个机器学习程序并不意味着你就能够训练到一个好模型,你需要大量高质量的数据来训练这个模型。处理大规模高质量的数据需要一个机器学习的平台,而且最好这个平台是基于云上的。业界基于云的机器学习平台大幅度的降低了AI技术的使用门槛。
AI目前的进展和数据与计算密不可分。首先,我们要获得好的机器学习模型,就必须要有大量高质量的数据。但是,在我们很多的企业AI应用里面缺乏大量高质量的数据,这是企业AI应用的一个重要的瓶颈。
如果我们大量的数据,我们可以训练一个深度模型,我们需要对数以百万计的参数进行调优,这需要巨大的计算资源。AI需要通用的计算资源,如CPU等,也需要一些专用的计算资源,如说PU、FPGA、TPU等。目前这些资源在体系结构上是排它的。一个子任务分给GPU去做了就会一直由GPU做。我认为,未来体系结构应该逐步走向融合,有灵活的调度。
基于云的AI平台是处理AI所需要数据的关键中的关键。在企业环境当中有不同的机器学习的任务和应用,我们应该怎么样去选取这个模型呢?一个原则是模型的复杂度一定要与问题和数据的复杂度匹配起来,否则我们要么出现过拟合或欠拟合的问题。不同的应用场景会往往有不同的复杂度和不同的计算量。要使企业的AI应用成功,不能够只靠一个模型。我们需要一个丰富的平台,提供丰富的AI模型和服务。
基于这样一个考量,华为AI架设一个通向业务智能的桥。无论我们是做AI+或者是+AI,我们坚信业务的最终业务价值是AI的最终价值,一定要解决最终业务问题。AI只有使得业务产生价值,才能够最终对用户有真正的作用,否则的话,空谈AI没有任何的业务价值。企业的业务价值永远是需要端到端的解决方案。从算法到算法对大部分的实际应用没有意义, 需要把数据平台、集成商、领域专家和业务用户协同起来。在企业业务当中的AI是一个以技术和服务平台作为基础,连接数据、领域知识、应用和用户,使各方面浑然一体、紧密结合、相互互动的解决方案。
基于这样的理念,华为AI推出了使能服务的框架。这是建立在华为深厚的行业解决经验。在最底层,我们有丰富的异构计算平台,包括了各种的不同硬件资源和计算资源,如传统的服务器及GPU、FPGA等设备,还有昨天刚发布的Altas。
在这之上我们提供一层平台智能服务API,覆盖了流行的机器学习和深度学习平台,如TensorFlow、Caffe、MxNet等。我们还提供了非常强大的图计算能力,可以在秒级响应内处理千亿条边百亿节点规模的图。这里面我们还提供了像搜索等一系列的基础服务来提供平台层的支持以及强大的推理功能。
在平台API之上,我们有通用AI层,支持视觉、语音、自然语言理解等这些感知和认知功能。用户可以在这层上构建通用的AI应用。
在这之上是我们的强项,领域和场景AI层,是我们理解行业、理解企业,提供行业领域的API,如我们面向智能、物流、风控、推荐问答、金融、制造等不同领域的API。对于一个行业来说,这层提供了一个Sandbox和一个工具集,可以用这些工具很容易搭建解决方案。另外,我们还提供解决方案的样本。这是我们华为把已有的成功经验拿出来跟业界分享。用户你可以根据这些蓝本很容易修改定制获得企业需要的解决方案。
我们后续会沿着这个服务框架逐步发布大量的服务,欢迎大家使用,也欢迎合作方在这个平台上贡献他们的服务,共同建设企业AI应用的生态。
点击此处下载裴健教授的演讲Slide
。