王小川要转型人工智能,到底是噱头还是大势所趋?
在近日举行的爱奇艺世界大会上,百度董事会副主席、集团总裁兼 COO 陆奇出席备受关注,最后却被其发言所用测试版PPT上的错别字抢了风头。尤其是搜狗CEO王小川的评论更是帮助百度PPT抢了头条,搜狗CEO王小川接连发声,一是指出“百度人工智能方向没毛病”,二是声称“百度更懂中文”,王小川借势的背后难道是刷搜狗人工智能存在感?
前不久搜狗CEO王小川在接受中国企业家的采访时却表示:“当下火热的人工智能都是套路,不会有所谓的AI巨头,也绝对不会取代人。”为何王小川会发出这样的感概?事实上,通过搜狗的人工智能之路,我们就不难看出王小川为何会发出“当下火热的人工智能都是套路,根本不能取代人”这样的感概。
随着人工智能技术的迅猛发展,谷歌、百度等都在布局人工智能领域,迟到的搜狗近来也开始转型人工智能。然而细观其布局与进程,搜狗的人工智能之路一直走得有些艰难,制造噱头无形之中就成为了搜狗人工智能刷存在感的“套路”。
噱头一部曲:夸夸其谈
过去谈人工智能技术和应用,往往需要抬着头仰望。但如今,国内言必谈人工智能的企业越来越多,而在宣传人工智能产品的时候又有多少企业为了吸人眼球而对人工智能产品夸大其词?无非就是想让更多的人关注自己的人工智能。
去年乌镇世界 互联网 大会上,搜狗官方称其机器翻译准确率达90%,未来有望取代人类同传。但这说法被多方吐槽,北京语言大学高级翻译学院教师PKUCATer就曾在知乎上表示,从搜狗机器翻译的现场表现看,90%准确率是很让人怀疑的。事实上,就搜狗机器翻译的表现来说,搜狗机器翻译能取代同声传译的言论,也确实难以令人信服。
一方面,同声传译难度大。同声传译是一种受时间严格限制、难度极高的语际转换活动,它要求译员在听辨源语讲话的同时,借助已有的主题知识迅速完成对源语信息的预测、理解、记忆、转换和目的语的计划、组织、表达、监听与修正,同步说出目的语译文。而机器翻译只能借助语音识别、语音合成等技术对源语进行系统的转换,达不到对源语的预测、理解等。实时机翻想要取代同声传译,至少在短时间内是不太可能的。
另一方面,搜狗机器翻译存在识别漏洞。此前乌镇世界互联网大会上,搜狗的翻译结果出现了不专业的“中式英语”还可以勉强接受。但是在香港 科技 大学演示过程中,机器翻译又出现了较大的翻译错误。例如:王小川提到“计算机的智能会去颠覆一个又一个的行业”时,中文字幕中的 “会”被错误地识别为“汇”,但机器翻译却还将“汇”翻译成英文。尽管事后搜狗方面将其描述为“机器翻译偶尔会犯的小错误”,但却无法掩盖机器翻译难以取代同声传译的事实。
虽然搜狗在人工智能领域投入了不小的人力、精力,但是要想在行业制造出更高的关注度来,就必须夸大其词,以震惊整个行业般的突破,从而制造出更大的雷声。
噱头二部曲:跟风借势
从2006年开始,越来越多的公司加入“医疗+人工智能”领域。在过去的四年间,这一行业迅速发展。人工智能在医疗影像、评估筛选药物、医疗机器人等领域大放光彩,“人工智能+医疗”因为市场需求大、前景广阔成了行业焦点, 投资 的风口似乎再次到来。去年,针对互联网医疗,搜狗大张旗鼓的宣布了上线“搜狗明医”频道,意图借助“人工智能+医疗”来拯救搜索医疗,颇有几分抢占“人工智能+医疗”风口的味道。
2016年,搜狗推出了“搜狗明医”。根据搜狗明医官方的宣称,用户在搜狗里输入症状关键词,可以进入人工智能识别服务页面,或者上传症状照片后,后台将帮助患者分析、诊断,表面看起来,这确实是“人工智能+医疗”应用的典型场景。但从体验的过程来看,却似乎没有找到人工智能的影子,人们最后得到的诊断完全是专家的意见。
近期,搜狗明医上线独家首创的智能自诊分诊功能。据说,可以根据用户身体症状描述,判断其可能患有的疾病并推荐就诊科室。但其自诊分诊功能只是停留在一个粗略的铺助诊断阶段而已,对于真正需要看病的人来并没有实际的帮助。
事实上,人工智能+医疗的研究关乎人命,所以对人工智能技术上有深厚的积淀和领先性有更高的要求,同时,它还需要拥有海量的医疗影像数据、患者资料做铺助,人工智能才能对医疗有所帮助。对于迟到的搜狗,缺乏先天的技术基因,而后天的积累十分少,无奈,寄希望于跟风借势,兴许能够抢占一把资本疯狂追逐下的风口。
噱头三部曲:制造假象
如今人工智能机器人,在服务员、医生、厨师、司机等职位都能看到它们的身影。我们不难发现,这些机器人只会重复做同样一件事情,据说比较聪明的搜狗汪仔,在一场比赛之后也不可避免的暴露出它只是个系统答题机器事实。
据悉,搜狗汪仔有较为完整的大脑,具备听、看、说和答题、聊天的能力,依靠语音识别、图像识别、语音合成和自然语言理解与计算实现,在多次人机大战中,战胜人类各个领域的天才和老将。但是人无完人,机器人也没有完美的机器人。在近期由机器之心主办的全球智能峰会的“人机大战”环节中,汪仔就暴露了自己语音识别的短处。
本次对决分为五轮,在一、二轮的比赛中,汪仔实力在线识别速度又快又准确。可是在难度升级的第三轮“语码混合”,语音播放中夹杂了中、英文的比赛中。汪仔遭遇滑铁卢,将“Jackie嘞?昨天跟你说的那个test run了没有?”识别成,“给a。昨天跟你说那个太失望了没有?”汪仔听写出的文字句不成句,没有了之前无敌的劲头。从这次对决可以发现,汪仔现有的语音识别技术还缺乏表达因果关系、判断语句对错的能力。换句话说,搜狗的人工智能技术还十分薄弱,要追赶上目前的人工智能,恐怕对王小川和搜狗而言会很吃力。
我们可以看出,在语音清晰且现场环境良好的条件下,汪仔可以依靠语音识别、图像识别、语音合成和自然语言理解与计算实现答题和思考,但面对口音、方言、错误表达时就难以招架。显然,汪仔不是可以代替人类的全能机器人。但是通过制造噱头炒作,却可以给大家制造一种搜狗人工智能遥遥领先的假象,对于搜狗而言,何乐而不为?
由此看来,对于目前搜狗的人工智能技术而言,与谷歌等科技公司确实存在一定差距,借“套路”之由更多是为了对投资人掩饰现实的差距。如今王小川改口“人工智能方向没毛病”,是否是当初的理由已经无法说服投资人了?很明显,搜狗也开始意识到:噱头这步棋已经走不通了,也非长久之计,最终还是要靠落地的技术才能走得长远!才能赢得资本和市场的一致认可!
刘旷,以禅道参悟互联网、 微信 公众号:liukuang110