走进零一科技节 三角兽COO马宇驰讲述人工智能语义
人工智能是一门涉及非常广泛的科学,包括语音识别、语音合成、感知智能等,其中人工智能语义也是非常重要的板块。2018年7月6日,在深圳举办的首届零一 科技 节中,三角兽科技创始人兼COO马宇驰先生就为我们重点讲述了究竟什么叫人工智能语义。
三角兽是一家人工智能语义公司,基于大数据和深度学习算法,提供对话式交互解决方案和端对端交互系统,大幅提升效率,降低成本。公司有由来自微软、百度、阿里、IBM、乐视等企业的资深算法工程师团队和连续 创业 经验丰富的市场运营团队。三角兽目前已经与微软、百度、中国移动、富士康、新浪、小米、锤子、恒生、Rokid等达成合作,是国内人工智能语义领域发展最快,技术应用落地领域最广的公司。
马宇驰认为, 国内95%甚至更多打着人工智能标签的公司都是伪人工智能,人工智能和非人工智能一个比较大的差别,即机器学习和深度学习的算法上面分别占了多大的比重?以及人工的部分占了多大的比重?真正的人工智能公司,要在算法的层面占到很大的比重,可以用机器去处理事情,而不是通过人。那么人工智能语义是什么?
据马宇驰介绍,人工智能语义相当于脑,做的是大脑负担的事情,负责看懂听懂自然语言。例如我们说1、2、3、4,大屏幕就会显示出来1、2、3、4,这个是把声音转成文字,而智能语义就是负责在转成文字之后,怎么去处理它,回应它。
马宇驰还说到,人工智能语义分为三个部分。第一个是语义理解,就是让机器听懂人话,并且给你回馈。我们每个人每天对 手机 有很多操作,无论复制、剪切,在APP当中查找东西,还是说你自己脑子里记住了跳到百度搜索引擎或者跳到哪里查找,这里相当于你有大量动作,从一个里面跳到另外一个里面,智能语义能解决你手机里任何一段文本,不管长短,当你要对它做一个动作的时候,我们就会给到相应你想要的一些资源、信息、服务等等。
第二个是开放域聊天。开放域聊天就是闲聊,例如小米音响,你可以跟它说任何话,它都会给一个相关性极高的回复,这个我们叫开放域聊天。这和原来市面上做的聊天有一个本质的差别,其他的公司主要是用库和关键字。比如,我们正常聊天的时候会有很多问题,那机器如何去回答呢?这就靠关键句抓取,实在不行链接到百度百科、链接到知识上,构成几十万的库。但我们的开放域聊天系统,已经上线的语料是接近70亿种,这个是目前中文系统上最好的聊天的部分,这部分我们是百度、微软、BAT的金牌合作方。
第三个部分,任务驱动的多轮对话,是大家更容易看到和理解的,例如很多机器人订餐、订票的应用。举一个例子,大家看到谷歌开发者大会上那个订做头发和订晚上吃饭位置的声音,那是一个TDS合成的声音,像人的声音一样,但是投入成本非常高,这其实是在技术上包装了一层场景。
最后,马宇驰谈到如何用技术眼光看待产品?很多人工智能公司喜欢单独秀一个没有技术壁垒的应用场景。比如问机器邓超和他老婆演过什么电影?这个从影视库和电影演员库做一些基础关联就OK了。真正的技术壁垒是在对你说话时吞字、落字的识别,比如有部电影叫老公们的私房钱,你说了男人们的私房钱,机器也可以识别出来,这个叫模糊语义理解,咱们聊天可能有一两个字是错的,但是这句话你能理解是什么意思,这个才是语义。相当于我们的大脑,会自己去识别和思考。我们今年还会有更多的产品落地,目前包括小天才手表,米2,百度小度2S的儿童版聊天、成人版聊天等等。
为什么参加零一科技节?
马宇驰认为零一科技节通过沉浸式场景布置,推动了科技落地以及加快了AI 商业 化进程,这是一件非常有意义的事情。在人工智能行业,没有投入商业应用的产品与技术并无价值,只有将技术方案化的落地到实际场景,实现行业的降本增效才有意义。零一科技节为参展的企业打造了一个全场景商业空间,将每一项技术、每一款产品进行了有机整合,帮助科技产品找到市场应用场景,推进AI行业落地进程。