GMIS 2017:构建商业AI能力的五个要素
5月27日,由机器之心主办的全球机器智能峰会( GMIS 2017 )在北京898创新空间举行。“LSTM 之父”Jürgen Schmidhuber、《 人工智能 :一种现代方法》的作者Stuart Russell、Citadel首席人工智能官 邓力 、腾讯AI LAB副主任 俞栋 、今日头条副总裁、人工智能实验室负责人马维英、第四范式创始人、首席执行官戴文渊、地平线 机器人 创始人 余凯 等嘉宾出席。
Jürgen Schmidhuber首先回顾了20世纪的人工智能发展,他说:“再过几年,90%的工作将是机器提供的。希望人工智能可以为我们提供更美好的未来”。 Jürgen预测,在未来几年人类将创造出具有灵长类动物智能的人工智能系统。人工智能仅仅经历了70余年的发展,这个速度相比数亿年的生物进化有了很多倍的提高。
无监督学习是深度学习很重要的一种方法,不用给系统提供一个非常具体的信号,只需要告诉它一些信息,让它以无监督的方式自己学习。Citadel首席人工智能官邓力发表了主题为“无监督学习的最新进展”的讲话。他说:“ 无监督学习比监督学习更有趣,但是也更困难。我们可以使用更多的一些数据来进行学习,比如说像SPDG方法,该方法不需要进行标记,但它可以直接进行学习来听声音的识别或者说做一些翻译。这样的一个线性的方式,我们也需要很多的发明来使无监督学习更加地有效 。”
腾讯AI LAB副主任俞栋介绍了最近在语音识别当中的前沿的研究方向: 序列向序列转换的问题。语音从一个序列向另一个序列转换的时候可能有问题,通过数据驱动让模型,可能找到更好的方法,使序列转换更准确。 序列转换主要有两个方向,一个是CTC模型,建模比传统建模非常更大,可以相对比较自由选择建模单元,而且建模较大可效果更好。但是,这种建模训练的稳定性不是很好。
那么如何解决CTC模型不稳定问题呢?目前最佳的解决方案就是把CTC与Attention结合起来,因为CTC有持续信息,可根据后面的语音信号生成词,这有助于Attention生成更好的表达。
人工智能热潮还很汹涌,新闻搜索也在发生巨变。 今日头条副总裁、人工智能实验室负责人马维英表示,今天的人工智能的本质是软件产业的革命,其实软件产业也在被颠覆,未来是 万物互联 、数字表达的世界。基于 云计算 、GPU、TPU和FPGA等一些芯片大运算能力,软件也变得越来越智能,反过来软件又会推动硬件的发展,这是一个正循环。
未来个性化的信息流成为新的方式,用户有大量碎片化的时间,很多工作都可以在手机上完成,同时产生源源不断的数据。
PC时代的信息源与消费者之间的关系不紧密,但是现在的大量的原创作者(比如头条有50万的作者)提供了大量内容,用户通过头条的平台可以获得个性化信息。头条就是要成为个性化信息流进流出的管道,通过机器来完成审核,过滤。
创作、分发、互动等每个环节,人工智能都可以进来,今天已经从数字化的时代向语义表达的时代转变。头条开发了很多人工智能的标注工具,帮助他们标注得更好,他们标注的结果可以得到一些另外的反馈,又重新来帮助我们的机器学习,机器学习又学出更好的算法,又提供更好的工具给审核标注人员,审核标注人员又更高效的标注了很多新的样本,形成一个闭环。
他还提到,未来的相机是一个视觉智能的相机。人工智能将连接人与信息,帮助用户交流、学习,用户使用数据又将反馈到机器,形成一个良性的循环,未来是超级智能时代。
第四范式创始人、首席执行官戴文渊谈到了VC维理论。统计学家很早就给我们奠定了机器的理论:VC维理论。 它是指一个模型的维度越高,能力就越强。机器超越专家的界限是VC维度大于或等于1000万。
他还谈到构建商业AI能力的五个要素:
1、 大数据
大数据不是指有数据就行,一定要有意义的过程数据才行。比如用户浏览网站数据,不只是点击量,还有客户正负反馈。用户投诉是正反馈,如果没有投诉是负反馈。优秀的AI模型,至少要1000万以上的大数据和样本。
2、外部反馈
例如搜索的点击,过去的推荐是相关的内容,这种“相关”机器听不懂,不可度量;现在把“相关”数字化了,它包括点击、阅读时长、转发、收藏和投诉,是可以被度量的。
3、算法
算法科学家是非常稀缺的,尤其在AI领域,那么如何不用科学家也可以做应用呢?过去做一个AI可能需要上百个科学家,现在可以把这些业务封装起来,我们希望一个业务人员,再加上有一定数据思维基础,经过平台培养一两个月的数据工程师,就能达到过去算法科学家的效果。
4、降低门槛
现在机器的门槛主要是数据清洗,特征变换。这对科学家来说不是很大的问题,但对于开发人员门槛很高,我们要使这些事情自动化,比如做线性分形的算法,用分型技术让线性的模型做更好的特征工程。
5、Inferential,大数据下没有简单的问题,比如机器超过100台,不能保证任意两台机器传输数据都是一样的,也不能保证机器不会宕机。如果超过一千台机器,甚至任务分配都会非常不均衡,有的机器是空闲的,有的机器会很忙,这些都是需要解决的问题。
国内谈AI,更多的是互联网的应用,很少提及它对工业领域的改变。 英伟达人工智能城市CTO Mulind Naphade谈到AI在交通领域的应用。
他表示,交通行业是一个非常复杂的系统,这里面有车辆、桥梁,人员等,非常复杂。AI在交通行业的应用潜力巨大,可以通过AI系统把很多的东西通过物流送到各个地方。在行人方面,可以探索AI集成一个系统,利于安全出行。
此外,AI还可以做安全监测,包括机场、地铁还是很多人群聚集的地方,在应急情况下,通过分析视频信息及时疏散人群。
而且AI货运将影响未来的物流行业,未来最后一公里的快递可能会是 无人驾驶 汽车运送,它还能实时了解仓库,形成一个高效的物流体系。
随着这一轮人工智能的浪潮涌起,自动驾驶也被推向高潮,在CES2017展上,它也代替去年的VR成为全球媒体关注的主角,自动驾驶很可能会颠覆万亿级的传统汽车行业。 地平线机器人创始人余凯谈到了“深度学习如何引领驾驶革命”,他认为,中国是世界第一大汽车市场,但是交通事故的死亡率也是世界第一,AI可能改变这一现状。
我们知道人工标注数据成本非常高,但是现在机器不仅可以用实际的数据学习,还可以通过虚拟的数据学习,人工智能系统在迈向一个方向:人工智能系统自己学习。
最后,他总结了四个观点:
1、汽车行业一定会被大数据和深度学习改变;
2、构建一个自主学习的汽车,而不是被人工标注数据训练的车;
3、我们需要努力设计神经网络的结构,使它透明,可理解,可以被控制;
4、我们要联合软件和硬件,最大化整个计算的效率、安全性和系统的可靠性。
重磅福利!【 2017中国互联网+新商业峰会 】, 6月15-16日两天3000人次,携程创始人梁建章,嘉御基金创始人、前阿里巴巴CEO卫哲,分众传媒创始人江南春等嘉宾已确认出席,期待你的参与, 限量钜惠 票 等你拿!
本文作者许伟军,亿欧专栏作者;微信:xuweijun24(添加时请注明“姓名-公司-职务”方便备注);转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。