专攻语义理解,小信子想让机器真正听得懂人话
据悉,语音识别的准确性已高达98%。人工智能在语音识别上已取得突破性的成果,科大讯飞、思必驰、云知声等语音识别公司,已经渗透到了生活中各个场景。
然而,李开复曾在“2017年投资界百人论坛”提到,「语音识别是所有技术里面最不成熟的,当我看到一个一个的计划非常担忧,99%会死掉。……你们不要看科大迅飞的演讲说懂得语音了,他一点不懂。」
听得见听得准,不意味着听得懂。目前的语音识别,是把声音直接转成文字。尽管,语音识别得发展速度,超乎所有人想象,可喜。但不能回避的是,语音识别,还是理解不了人在说什么。以当前常见的语音助手来说,除了一些特别简单的问题答得出来,其余的问话,则是答非所问,不知所云。要实现真正人工智能,语义的理解是必不可少的,否则只能被调侃为“人工智障”。
文化传信(厦门)公司总经理胡天宝说到,「当前,人工智能自然语言处理方法,不能算真正意义上的理解。说穿了,只是用大量问答语料库,沿用统计学的方法,使用大容量服务器进行计算,不停给语料库投喂数据。费电,费人力。一旦你换个语序问问题,或者提点语料库里没有的问题,它根本回答不了。」
香港文化传信集团于2014年4月在厦门成立文化传信(厦门)软件科技有限公司,专注研发小信子云端中文理解服务引擎。早在2003年,文化传信集团研发完成了全球独一无二 “中文中国芯” — “飞龙CPU”。2006年,文化传信公开首部全自动图文系统(人工智能分析剧本自动产出3D动画)自制影片《记承天寺夜游》。
当前,文化传信推出了产品——小信子,专注在中文语义理解,试图砸开,语音识别和人工智能之间,隔着的那堵墙。小信子,作为云端中文理解 API 生活与文化服务平台,提供全方位中文理解核心技术服务。
简单来说,小信子平台是可以对接到智能软硬件里的技术,例如机器人、智能音箱、智能家居等,提供单一接口 API 服务,大大降低开发者研发时间与难度,用最低成本,去让机器听得懂人话,更懂中文。
小信子,以主程序 1825 KB,完成中文理解的核心工作,是目前最节能与最环保的自然语言处理核心。计算机在不需要大数据问答数据库的情况下,就能理解中文自然语言。而这小体积轻量级的程序,却比市面上的机器人,更听得懂人在说什么,可以提供单一界面API,一次搞定天气、备忘、时间、交通、文化、饮食娱乐、理财、解问、聊天、搜索、健康、新闻百科、四则运算、外语翻译等等多种应用场景。
小信子(左)与其它家(右)问答机器人比较。
小信子基于朱邦复先生「汉字基因」理论,从汉字根源下手,去解决 NLP(自然语言处理)的问题。靠的不是数据库,而是语义上的理解。不得不提,朱邦复是仓颉输入法发明人、中文计算机之父、汉字基因理论创始人,同时也是文化传信公司前主席。
有业内人士称,“听的懂”才是自然语言人工智能在未来十年内,最为关键的问题。这些年NLP的研究,开始热起来。也逐渐地发展成为一门独立的学科。在产业界,越来越多资金资源向这个领域去靠。
语义理解领域出现了三角兽、蓦然认知等产品,目前都更倾向于利用芯片、算法、数据模型来推进NLP(自然语言处理),以求达到语言上理解和交互。Global Market Insights的数据显示,2017-2014这七年,智能语音交互的全球市场,每年增长率将达到34.9%。据估算,2024年的全球市场规模,将达到720亿元。目前语义理解行业中还未出现真正意义上的独角兽,创业公司仍有很大机会。
胡天宝认为,基于大数据、并行计算的深度学习的自然语言处理,不是最好的路子。语义的复杂性,包含因果关系和逻辑推理的上下文,靠海量数据是整理不完的。回归到中文语言逻辑上,才能实现真正的人工智能。
文化传信团队在人工智能语义理解领域已深耕十几年。生活助理类中文语义理解引擎已可以应用到更多商业产品中,实现真正意义上的中文理解。
小信子团队共十余人。由朱邦复先生进行理论指导。董事长沈红莲毕业于台大中文系,是汉字基因中文人工智能专家、云端中文理解核心的总设计师。总经理胡天宝是中国科学院研究生,小信子云端中文理解 API 系统设计师。其它团队成员主要来自港澳台以及大陆,主要由软件设计工程师,3D 动画师以及工业设计师所组成。
目前,小信子中文理解 API 服务平台已于2017年1月3日在阿里云平台正式上线,寻求更多商业合作机会。
产品:云端中文自然语言理解引擎
公司:文化传信(厦门)软件科技有限公司
官网:
www.xiaoxinzi.com