王小川:搜狗未来将推出颠覆性硬件产品
雷锋网按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网(公众号:雷锋网 (公众号:雷锋网) )、香港中文大学(深圳)承办,得到了深圳市政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。
6月29日,搜狗CEO 王小川 CCF-GAIR 2018发表题为《搜狗的AI之路与挑战》主题演讲,他对张钹院士所发表的“人工智能到今天理论框架尚未形成”观点表示“说得很重”,他称,目前人工智能仍处于原始阶段,但目前包括谷歌、搜狗,国内外大量公司都在持续大量投入。
以下是雷锋网在王小川演讲基础上进行不更改原意的整理:
搜狗本身是面向消费者的公司,因此最大优势也是拥有海量用户,使得搜狗有场景去展示AI技术、收集大量的数据。用户规模上,搜狗是第四大中国互联网公司,第二大搜索引擎,第一大中文输入法,海量的用户基于搜狗构造实现AI的良好环境。
王小川称,搜狗构造自己的AI 能力,就是以语言为核心,上层是感知系统——包括语音与图像,下层包括对话、翻译、问答,这是搜狗整体理解AI的切入点。
2016年,搜狗首家发布同声传译系统,预计在2020年达到优秀同声传译效果。而基于翻译的技术,搜狗于2018年3月与5月推出旅行翻译宝与录音翻译笔。翻译方面,王小川称,搜狗有清晰的场景、输入法、搜索引擎,另有实景翻译功能也在不断改进。
相对来讲,问答与对话会更为复杂——王小川称,他判断AI时代搜索的未来会走向问答。未来用户会更多地用自然语言表达,并由机器给出答案。王小川用去年搜狗问答机器人汪仔参加的电视节目《一站到底》举例称,在知识问答体系内,机器人已经在确定性答案里做得比人类更好。
相对之前IBM的沃森而言,汪仔机器人进步更大——一方面是因为汪仔全程可通过语音沟通,沃森是用文字输入,同时,搜狗汪仔背后依靠的是基于人工智能技术的搜狗立知问答系统。
据雷锋网了解,立知是搜狗搜索研发的面向未来的搜索技术,在理解用户的问题或信息需求后,利用海量网络信息及大规模知识库,直接给出答案,方便快捷,适用于多种交互方式。
问答之外,搜狗另一个重要工作就是对话。王小川称,搜狗在对话方面分成几个领域在做——
-
一是任务型对话,即类似微软小冰等智能音箱类的;
-
其次是智能回复,帮助人类去跟机器对话;
-
第三是机器帮助人,让人回答得更轻松。
王小川以搜狗上市为例称,当时很多朋友发来祝贺信息,对象不同、回复内容不同,即需要一个足够智能的机器帮人去判断对方是谁、回复什么内容格式,因此语音输入并不足够,还需要将输入从填空题变成选择题。
王小川称,目前搜狗已经在多个垂直领域运用到这些新技术——例如客服领域、销售领域、医疗领域等。以前传统对话系统是机器与人的互动,聊天机器人的需求价值不清晰,传统数据难积累,没有统一的标准与评测。如今搜狗在辅助对话里将人与机器结合起来,进行更科学的设计来提升效率。
据雷锋网了解,这个项目搜狗从2014年开始做,先是在短信里做自动回复,用3%搜狗输入法用户做测试,2016年做到日活800万、月活2000万规模。之后设计手机短信走向聊天软件,在句子长度、句式等方面难度都更大,因此团队建立更复杂的系统模型,将聊天做到展现率50%,点击率10%的规模。
此外,搜狗更多想法是希望超越目前语料对话系统,核心概念便是引入知识。例如“有什么好影片推荐”这个问题,答复就是一个问答系统;“得了鼻炎怎么办”的答复,既可以将医疗知识引进入,也可以带来新的商业模式。
但是,王小川称,目前对话领域仍有很多问题、也很难。例如个性化风格问题,例如“不认识、不认得、认不得、我不认识”四种说法,很难区分出来。因此搜狗之后会在系统内引入个性化元素,让机器更聪明。此外,本地计算、隐私问题等都需要不断深入改进。
最后,王小川预告,搜狗将推出颠覆性智能硬件,AI技术也将推动知识计算,最终在新硬件入口加上机器对于问答的理解,合成新的虚拟个人助理。
。