王小川力挺人工智能 有信心比谷歌百度做的要好
【环球科技报道 记者 李文瑶】2月21日,搜狗发布2016全年财报及2016第四季度财报。根据财报显示,2016年全年,搜狗营收44亿元人民币,同比增长19%,非 美国 会计准则下的净利润达6.4亿元人民币。其中,2016年第四季度,搜狗营收11.7亿元人民币,同比增长11%。
对于这几年的发展,王小川最大的感慨是:搜狗搜索活下来了,同时也是唯一一家既有PC搜索也有无线搜索,市场份额、收入利润在上升的公司。
而在以“自然交互+知识计算”作为长期核心战略下,搜狗不断加大了对人工智能技术的研发投入,在接受环球科技采访时,王小川透露:如果与谷歌和百度做对比,我们有信心比他们做的要好。
1.8亿建研究院 人工智能与搜索早已密不可分
2016年4月,搜狗向清华大学捐赠1.8亿元,成立了 中国 首个校企合作人工智能领域研究院——天工智能计算研究院,进行人工智能领域前沿技术的研发,并在语音识别、图像识别、机器翻译、自然语言理解、智能问答等方面相继取得突破与产品落地。
从2016年全年财报来看,无论是在营收44亿人民币,还是在净利润达到6.4亿人民币的情况下,1.8亿的研究投入都不是一笔小数目。而这1.8亿的产出比更是令人关注。
2017年2月,搜狗和清华大学天工智能计算研究院联合研发的问答机器人搜狗汪仔正式登陆江苏卫视《一站到底》,在挑战中战胜真人选手。此次挑战的复杂性和难度远高于此前IBM Watson等参与的类似人机比赛,而搜狗的1.8亿投入似乎也有了更为直观的效果展示。
王小川为何执着于人工智能?
在王小川看来,搜索和人工智能早已密不可分:“搜索就是人工智能,人工智能是搜索的基层属性,而搜索也是人工智能最好的展示场景”。尤其是在深度学习技术获得更快的发展之后,搜索场景也有了更好的工具来满足人们的需求。
在搜索的输入方式上,语言成为了除键盘外的第二选择,而在业内看来,语音识别才是人机交互的发展未来。如何让机器更加自然的理解人类的语言,实现人机交互的自然对答,也是目前最为重要的研究方向之一。
王小川透露,搜狗每天的语音识别需求已经超过2亿人次。语音搜索已经有了市场基础。
在人工智能时代里,最难的地方不仅仅是图像的识别和语音的识别,而是人的思想和知识的学习,同时人最宝贵的不是图像和声音,人的难点在于知识的理解和推理能力,这种能力是靠语言体系来支撑对知识和思考的表达。而搜狗在这里面是两个场景,一是输入场景,让大家用语言表达,二是用语言获取信息。
“我们在人工智能场景里细的分类是分在自然语言里,自然语言代表了对知识和思想在这里面的人工智能,这里面是人工智能最难的一块。”王小川解释道。
搜索和人工智能是一体的,而想做好搜索,人工智能是必然要突破的技术道路。
内容差异化发展 精耕垂直搜索领域
从2016年5月起,搜狗连续发布了明医、英文、学术等搜索产品。第四季度,搜狗英文搜索全面升级为海外搜索,这是全球首个跨语言搜索引擎,当用户在输入中文查询词后,可直接获取英文结果和对应的中文翻译。旨在帮助不精通英文的中国人,搜索和阅读全世界的医疗、科技、人文信息。
搜狗的战略是:发展以自然语言处理和自然交互为核心的人工智能,以此来实现问答式的搜索。而相比于通用搜索,2017年搜狗将继续升级垂直领域的搜索产品,发力人工智能,专注往问答搜索方式迈进。
王小川对于垂直领域的搜索产品有着很明确的认识,他表示医疗搜索和英文搜索是通向未来两个很重要,可以展开无限想象力的事情。2015年,搜狗发布微信搜索和知乎搜索,固定了基本形态。
在医疗搜索方面,搜狗没有创业公司的赚钱压力,对其而言,只要用户认可搜狗搜索,有足够大的搜索量,搜狗搜索有良好的商业模式。
而在英文搜索方面,已经升级成为海外搜索,最后的搜索结果通过中文进行呈现。在搜索过程中,把翻译和搜索做一个联动,而海外搜索也会成为搜索竞争中的差异化。
根据数据统计,截至2016年12月底,搜狗搜索整体流量较一年前增长30%,特别是移动搜索流量增长70%,对整体流量的贡献达四分之三。根据CTR报告显示,搜狗搜索PC端、WAP端和APP端三个终端总覆盖人群比例达30.4%,位居行业第二。
产品升级 尝试更多场景突破
对于2017年的规划,王小川表示将继续对新推出的搜狗名医和搜狗海外两大垂直搜索产品做升级,同时将会加大对人工智能平台的开放,从搜索领域逐步拓展,探索智能硬件产品,多场景做突破。“通过语言将搜索升级到对话系统、问答系统以及翻译系统,这是我们核心能力的三部分。”王小川说道。
《一站到底》中的提问表现可以认为是搜索对未来的一种模式,而事实上,问答处理能力是比较宽泛的,不仅能找到实体,还能在里面做更多的运算。
语音识别是从语音到语言,合成是从语言回到语音,但处理的核心是语言,因此搜狗也希望能够把语言的能力,结合语音、图像和其他方式放到手机之外的硬件里。
“我们人工智能的逻辑不仅是放在输入法和搜索里,产品形态里有几个关键词:输入法,搜索,自然语言的计算,自然的交互。他们支撑的地方是对话的问题,问答的问题以及翻译的问题。我们希望在这几个场景里,大家都能看到搜狗的声音,尤其硬件、IoT到来的时代,无处不在会有交互和机器智能,这是对未来的判断。”王小川说道。