让人工智能帮助更多行业,有多远路要走,第四范式大牛陈雨强这样回答

亿欧网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
让人工智能帮助更多行业,有多远路要走,第四范式大牛陈雨强这样回答

2017年1月,百度首席科学家吴恩达在接受采访时说,他认为未来五年 人工智能 的重要研究方向将是 迁移学习 ,这是一个非常有活力的领域。而提到迁移学习,就不得不提一家人工智能初创公司—— 第四范式 。

第四范式是一家致力于利用机器学习、迁移学习等人工智能技术进行 大数据 价值提取的公司。别的不说,它的阵容就足够亮眼。

首席执行官戴文渊,ACM世界冠军,原百度T10员工,其在研究生时发表的论文在迁移学习领域论文引用数至今排名世界第三。

首席科学家杨强,港科大教授,华人界唯一的国际人工智能协会院士,曾任华为诺亚方舟实验室主任。

首席研究科学家 陈雨强 ,全球人工智能应用领域杰出科学家,曾在百度凤巢主持架构了世界上第一个商用的 深度学习 系统。

这样一家公司和它的产品,会能给我们带来怎样的惊喜呢?带着好奇,亿欧采访了第四范式首席研究科学家陈雨强。

第四范式的主要产品“先知平台”,究竟能做些什么?

2016年7月,第四范式发布了先知平台。这是AI领域首个面向开发者的开发平台。它由顶尖科学家设计算法并集成到平台中,降低了特征工程化和模型训练过程中的人工参与程度,同时降低了数据价值提取中对数据科学家的依赖。而第四范式也凭借先知平台,在“第六届吴文俊人工智能科学技术奖”的评选中,荣获一等奖。

简单来说,先知平台降低了两类人的门槛,一类是人工智能系统的开发者,一类是 数据挖掘 模型的使用者。

前者换个说法,也就是降低了公司招人的门槛,让第四范式可以在比较短的时间内,将相对基础没有那么好的人,培养成合格的员工,具有做出AI应用的能力。陈雨强说:“这就好像曾经的科学家写程序要打纸带,这样的人当然很难找;但是后来出现了ios,写程序也就简单很多了。”

在第四范式内部,非技术人员通过1、2个月的学习,也可以进行建模,并且取得了不错的效果,甚至还举办了专门针对非技术人员的建模比赛。

而后者,则是降低了银行员工,也就是使用先知平台的客户需要的技术门槛。让银行业务人员不需要太深刻的数据知识,也可以进行建模并且完成对数据价值的提取。

先知平台的机器学习建模平台+在线预测服务部署在公有云,同时第四范式提供培训,帮助企业零门槛地构建自己的机器学习能力,这样有助于客户因地制宜的选择适合自己的能力和方式。

适应金融领域,目标是让更多公司用上更好的人工智能

可以说近两年,随着互联网金融的崛起,传统银行业的增长速度出现了明显放缓甚至停滞,这种情况让他们产生强烈的危机感,并且迫切的希望能够找到突破的方式。

而第四范式之所以选择 企业服务 这条路,也是因为这个原因。陈雨强表示,第四范式在推进业务的过程中,感受到了市场强烈的需求。互联网,金融,以及各行各业,都在努力尝试,如何用AI让其运营更精细,效率更高。

陈雨强举了一个简单的例子:在过去,可能一家银行有5000万用户,它会将他们通过不同的维度分为500组,然后采取相应的服务方式;而现在有了机器学习,甚至可以将5000万的用户分为5000亿组,从很多维度为同一个用户采取不同的服务方式。这样的提升,有助于帮助客户在针对不同用户的营销和服务上更加精准,从而大幅提高营销响应率。

在传统数据挖掘软件中,例如Spark或者Storm,定性来说也可以完成这样的数据价值提取工作,但是速度太慢。第四范式为先知平台搭建了独立开发的计算框架GDBT(超大规模并行机器学习框架)。数据量越大,它的表现越优秀;当处理3000万条左右的数据时,其速度大约是Spark的400倍。

由于诞生于金融行业,先知平台也更适应金融行业。目前,第四范式的客户也以银行为主,包括光大银行在内的多家银行都已经与第四范式达成了合作。

迁移学习,未来五年人工智能的重要研究方向

第四范式首席科学家杨强曾说,深度学习过去过去,强化学习是现在,而迁移学习是未来。

而先知平台的核心技术就是RTL(Reinforcement Transfer Learning),也就是一个将深度学习、强化学习和迁移学习有机结合的机器学习体系。

在这之中,深度学习是主体,强化学习解决了延时反馈的问题,而迁移学习则解决了该系统在适应其他领域或需求时的“冷启动”(新领域的经验或数据不足)问题。

陈雨强表示,迁移 学习的意义就像是人类语言学习中,如果让一个零基础的人学习法语自然很难,但如果让一个学过英语的人再去学法语就会相对容易很多。它可以利用一个环境中学到的知识,来帮助新环境中的学习任务。

简单来说,迁移学习主要解决了目前机器学习中存在的两个问题:

第一,是数据量不足的问题。 虽然互联网和移动互联网催生了数据量的爆炸式增长,但在一些非互联网领域仍然存在数据量小的困境。医疗领域就是一个典型,有一些发病率较低的疾病样本数量很少,但会存在与它相关联的疾病和治疗方法,我们就可以通过已有的模型进行迁移,从而对疑难杂志进行大数据分析从而得出有效的诊疗方案。

第二,是个性化推荐的问题。 每个人的喜好兴趣都不相同,通过数据可以分析出一个人的用户画像,对他进行内容的精准推荐。但如何给一个没有书籍浏览信息的人进行阅读推荐呢?这可以通过迁移学习,对他的音乐、艺术作品兴趣,包括学习经历等一系列信息,与他的阅读兴趣进行关联,从而实现在没有该领域数据积累下的个性化推荐。

当然,迁移学习也不是万能的。目前,领域内的迁移学习可以做到,因为同一领域内的A和B事件可以找到相应的关联;但是跨领域的迁移学习就很难实现,虽然学术界有这样的应用,但是商业环境下仍没有先例。

在非互联网的领域,AI能做的还有很多

陈雨强说:“在过去,也有一些专用的人工智能,这些智能也都非常厉害,能够解决专业的问题,但是要把人工智能用到更广泛的场景和领域上去,还需要进行非常大工作量的丰富和理解。”

现在,已经有包括内容推送、互联网金融、精准广告营销等一系列互联网领域获得了人工智能的支持。而未来,随着技术和产品的进一步加强,还会有更多的非互联网行业,例如医疗、制造业等,使用上AI技术,

陈雨强说:“我们之所以能做这样一件事,也是建立在之前非常优秀的经验上的。这里面有过去互联网公司的一些经验,比如谷歌和百度,我们把他们的一些经验在更广泛的行业上进行了推广,并且做了一些改进。”

要实现AI For Everyone这件事,不仅仅是解决核心算法如何调用,这里面还包括了数据如何导入,怎么进行拼接整理,怎样模型训练和评估,以及上线之后如何反馈,形成闭环。这里面的每一步,都是数据使用者在过程中遇到的难点。

过去,像BAT和谷歌这样的公司才有运算能力,人才和数据来做人工智能这样一件事;而现在,数据的积累达到了一个临界点,技术也实现了突破,已经有一部分银行在使用人工智能进行数据价值提取。而作为银行用户的我们,其实已经开始受益于AI。

AI for everyone,这是第四范式的愿景,让每个人都能受益于AI,而他们现在其实已经走在了这样一条路上。

本文作者李基祥,亿欧专栏作者;微信:ligi_avd(添加时请注明“姓名-公司-职务”方便备注);转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。

随意打赏

第四范式 陈雨强第四范式 先知人工智能专业人工智能行业第四范式
提交建议
微信扫一扫,分享给好友吧。