微软亚洲研究院周明:口语机器翻译将在10年之内完全普及
【网易智能讯 6 月3 日消息】微软研究院在京举行自然语言处理媒体分享会,微软亚洲研究院副院长、国际计算机语言协会( ACL )侯任主席周明博士围绕 NLP 技术进行了交流和讨论。
会上,周明博士就自然语言处理、技术最新发展情况、未来展望等三个方面展开演讲,周明表示,自然语言处理是人工智能的一个分支,用于分析、理解和生成自然语言,以方便人和计算机设备进行交流,以及人与人之间的交流。
周明表示, NLP 技术对于微软来说,有着非常重要的意义,包括重塑生产力和业务流程、构建智能云平台、创造更个性化的计算,目前微软 深入 涉及 NLP 技术 的 项目有必应、 Cortana 、微软小冰、推荐系统、智能输入、辅助写作、机器翻译、智能客服、 Bot Framewor k 、认知计算、知识图谱、商业智能等等。目前,微软亚洲研究院已经发布一百多篇 ACL 论文,周明博士于去年被选为 ACL 候 任主席。
微软亚洲研究院还致力于结合中国文化开发和研究 NLP 技术 。 上个月, 微软(亚洲)互联网工程院副院长 李笛 宣布,即将满三岁的微软小冰又多了一重身份 -- 诗人, 2017 年 2 月至今,小冰已经在天涯、豆瓣、贴吧、简书平台用 27 个化名发表了作品,目前公开的化名包括:骆梦、风的指尖、一荷、以及微笑的白。有网友评论说:学会了看图写诗的小冰看起来更加的聪明可爱了。 而这其中 的很多技术都 基于 微软亚洲研究院多年来 针对 中国文化的 NLP 技术 研究积淀 。
此外,周明博士举了很多例子来展示微软 NLP 目前的研究进展,就不同语种同声传译开会的项目而 言 ,笔者认为这很值得期待,日后成熟推向市场将解决这一工作痛点。
但是,周明博士认为, NLP 的研究还存在一些亟待解决的问题和难点,比如机器阅读理解,他把机器阅读理解比喻为自然语言计算领域皇冠上的明珠。
在上图当中,我们人可以轻松的给出答案:多瑙河,但是目前即使是最佳的系统模型 R-NET 给出的输出也不尽人意,他的答案是:科隆。
可见要让计算机真正的理解文本内容并像人类一样可以对文字进行推理的难度是如此之大,在回答该问题的时候,计算机除了要处理文中的指代 “ it ”,还需要算法和模型进一步对“ larger than ”和“ after ”这两个表述进行推理,从而得知 Danube 是正确答案,此外,由于文字并没有显式提到 Danube 是“ river ”,所以这又加大了系统的推理难度。
但是大数据的发展也让研究者们看到了曙光,加上深度学习的算法以及海量的云计算资源可以针对长文做点对点的学习,即对句子、短语、上下文进行建模,这其中就隐藏了一定的推理能力,基于此,微软亚洲研究院自然语言计算研究组正在进行下一步的研究和探索,他们采用的是一个端到端的深度学习模型的解决方案。
分享会最后,周明表示,通过用户画像实现个性化服务、通过迁移学习实现领域自适应、通过无监督学习 充分 利用未标注数据等等方面都将成为接下来研究的主要方向,此外,他预测,未来 5-10 年 NLP 技术就可走向成熟,口语机器翻译完全普及、自然语言会话(聊天、问答、对话)达到实用程度、自动写诗作曲等等, NLP 还 将于其他人工智能技术一起在金融、法律、教育、医疗等垂直领域得到广泛的应用。