杨强教授:如何跳出科技“深坑”?
亿欧11月6日报道,今日,由 京东 金融 与红杉资本联合主办的首届“JDD-2017京东金融全球数据探索者大会”在北京举办。
杨强教授在演讲中表示:
1、深度学习、强化学习在实际中的应用:第一,闭环路径要短。 第二,反馈需要高频、高通量。 第三,反馈效果需要起到复合作用。
2、推荐系统当前的一个问题是过拟合。由于技术没有照顾到用户的准确性与多样性的需求。
3、迁移学习是会带来很多技术革新。它可以满足越来越多的个性化需求,实现千人千面。并且,迁移学习可以增强模型的可靠性,解决隐私问题。
4、技术的革新与商业在金融领域得到契合,因为金融是拥有简短的闭环路径,高频的沟通,可以产生复合效应,很快壮大模型的领域。
从学术的角度来看商业的问题,解读人工智能、金融、大数据方面的内容,我们会得到哪些新的发现?
来看一下ALPHAGO的成功,我们从ALPHAGO引起的振动中能学到什么,对商业方向有哪些指导呢?
首先,AlphaGo本身是几个算法的结合,如深度学习、强化学习。算法与环境需要有机连接,环境会不断给算法提供反馈。而深度学习既能显示当前的状态,又能为未来的行为提供指导。
这样一个算法可以应用到实际中吗?
第一,闭环路径要短。 商业路径、算法路径的中间不需要过多的环节,如从用户到获得反馈,再到通过AI算法获得补充返回应用,这个闭环要足够短。
第二,反馈需要高频、高通量。 通过不断得到反馈,系统获得刺激,使智能得到成长。
第三,反馈效果需要起到复合作用,这个经常被忽略。 人工智能领域复合收益是非常重要。如图,如果反馈对系统的增益持续进行,就会有指数型的收益上升。
从遇到的实际问题方面,有没有类似的场景可以满足的需求?
回顾人工智能的里程碑:
1997年,我们有深蓝。
2011年,我们有IBM watson。
最近又有了AlphaGo、无人车、德州扑克,这些都是我们引以为豪的人工智能。
在这些里程碑的成功背后是路径闭环足够短,反馈足够频繁。另外,这期间复合作用非常明显,系统持续的改进自己,智能不断的提升。
当下,人工智能的应用并不是在所有领域都会取得成功。我们需要仔细挑选,人工智能在哪些领域容易获得成功,在哪些领域需要等一等。
在技术与商业中,效益风口在哪?
首先来看一下技术风口。
人类的知识获得70%以上都是通过视觉的。深度学习的发展会对人工智能的技术与应用产生影响。用更好的、可解释的深度学习,理解物体之间的关系;取出通过视频理解的一些人类能理解的摘要,为人类和计算机的模型进行沟通。
自然语言紧随其后,深度学习为文本的阅读、理解、产生、问答、分析等等,带来很大的提高。但是,这个提高还是要随着算法的提升而持续完善,在使用中产生更大的效益。
另外一个,智能推荐。 智能推荐应用在电商、网上购物等。但是,我们在智能推荐会遇到的一个重大问题,是很容易陷入机器学习技术上拟合的深坑。当点击一个手机新闻,我们会得到很多类似新闻,系统不会顾及到我们对其他的兴趣。
怎么样解决这些问题呢? 这个就是技术上的革新所期待的,我们在这方面也在不断做新的研究。
人类很自然就会使用迁移学习。 我们在一个领域很专业,怎么把这个知识迁移到另外一个领域?能不能让计算机也有这个能力?业内专家认为,这就是人工智能机器学习的下一个热点。
迁移学习会带来很多技术革新。 如,可以在一些小数据上,应用大数据结果。在某个领域获得一个非常好的模型,可以把它迁移到周边小数据的模型上,这个也是人类学习的一个有效的模式。
迁移学习可以增强模型的可靠性。 一个模型的产生如果可以在不同的场合适用,那么这个模型就更加可靠。
迁移学习可以满足越来越多的个性化的需求,实现千人千面。 比如右边这个图表现,如果在云端得到一个通用的模型,可以把它适配到各个终端,使它在不同的终端就有不同模型的体现,这样就实现一个个性化。
迁移学习可以解决隐私问题。 每一个终端用户都不必把他的个性化的数据上传到云端,就可以得到它的结果。
所以,我们很期待这样一个技术的革新。
这里是迁移学习的一个实例,右边这个图表示迁移学习不一定是一步到位。 从一个模型迁移到一个场景,我们可以通过一系列的场景把一个模型迁移到不同的更广泛的范围。 例如,通用深度学习来做迁移学习。
最近斯坦福大学和联合国共同做了一个应用,利用卫星图片分析非洲大陆不同地区的贫困程度。利用这种所谓传递式的迁移学习,节省了大量的人力。过去是要派一些观察员到本地去做各种积累、各种调查,现在用卫星图片把白天和晚上的地球图象加以比对,训练出一个模型,大大节省了人力。
这些技术的革新与商业应用方向有哪些的契合?值得一提的是金融方向。
如上文, 一个是闭环路径的简短,一个是沟通的高频,最后产生复合效应,很快壮大模型。那么金融就是这样一个领域。
在金融领域有各种各样的场景,如与用户沟通的场景,金融的安全活体识别、识别用户本人。在后端,可以对用户整个风险进行分析,可不可以借贷。做一笔投资,投资前要进行风险分析,现在基于大数据和人工智能可以自动产生这样的分析,如个人和企业的征信。
另外 在运营、投顾方面,我们都可以借助于人工智能大量加强提高效益。 经济本身就是一个不断提高效益的过程。现在,人工智能又为提升经济效益增加了一股强大的动力。
正如风险管理分为监控、识别、评估和干预,每一个方面都可以有大量的人工智能参与。
从京东金融的实践来看,人工智能可以帮助养鸡,是一个非常有趣的应用。过去一个养殖户用12块钱养一只鸡,需要提前贷款。贷款会产生很大利息支出,对于养鸡户是一笔很大的费用。从鸡的成长来看,小鸡的时候不需要吃很多饲料,长大才吃,不同的鸡对不同饲料的需求也不一样。当能够掌握到这个过程的时,我们就可以因地制宜的放贷。从一开始养鸡户不需要借这么多钱,逐次增加。如果,能够做到按日计息,就能够大大提升效率。
现在,京东金融做到6分钱就养一只鸡,就是用人工智能的算法来做的分析。
推荐系统是大规模的机器学习系统,当前共有的一个问题是过拟合。 在一些新闻的APP上,当点了一类的新闻以后,后面会出现20个都是这一类的新闻。
这是为什么呢?因为,技术没有照顾到两个需求,一个是准确性的需求,一个是多样性的需求。
现在我们在研究上,我们在研究一个强化学习的模型,能够把两个需求全部照顾到,叫做迁移的匪徒模型。用这个模型既照顾到准确率,又召开照顾到多样性,把过拟合的问题彻底解决。
最后,我要说一下JDD背后是一个大赛,同时在中美两边进行。说起JDD,我要特别提KDD,即数据挖掘和知识发现,在学术界大家都听说过KDD。这样的大会已经有过20年的历史,每年由工业出题举办一场大赛,如今已变成我们发现优秀团队的一个方式。
今年的JDD也是采用了这样一个方式,在金融方面是非常大的机会。
并且,机会来自紧贴着金融应用的四个方面:
一个是登陆的行为识别, 发现有没有可能是欺诈的行为,需要深度学习与金融的知识两方面的知识。这也是JDD大赛的一个特点,我们不仅要技术上的革新,也需要这些参赛队伍能够写出一份商业计划,把商业场景想清楚。
第二,金融界非常关键的一个需求,就是信贷需求的预测,还有店铺销量的预测。
最后一个非常有趣的识别叫做猪脸识别,而不是人脸识别。
猪脸识别需要做什么呢?
首先,获取到大量数据,而不用担心隐私问题,猪可能不太关心隐私。与此同时,猪脸识别又是一个活体识别的问题。
这确确实实背后有一个商业场景的问题,我们可以设想一下,假如有学生参加这个比赛,一个场景就是可以帮助养猪户鉴别不同的猪在养殖过程中的各种活动。
比如,这个猪是不是活跃?是不是散养的?是不是一只爱动的猪?然后对健康做出决策,对预测保险。另外消费者可能也会有挑选,有人可能喜欢不同的猪肉,可能对整个的历史还有猪的鉴别就有个别个性化的需求。
所以既有深度学习的应用,又有商业的应用,所以这是非常有趣的一个题目。
本文系投稿稿件,作者:杨强;转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。