做听障人士沟通的转换器,音书App的语音识别要服务2054万用户
得益于深度学习与人工神经网络的发展,语音识别在2016年取得了一系列突破性的进展,在产品应用上也越来越成熟。
语音识别在市场与用户的落地上逐渐向可交互倾斜,语音与文字的实时转换已经不再能够满足大众对语音识别的想象,与此同时,科大讯飞的讯飞输入法和讯飞听见在用户终端和企业云端都实现了高准确率的语音实时转换。
当大家在强调语音识别的智能交互时,生活在无声音或弱声音世界里的一群人被我们遗忘了。
长期以来,听障人士与健听人间存在交流断层,而听障人之间的交流则通过手语实现,可怕的是我国的手语跟方言一样,不同地区的用法存在差别,很多时候听障人与外界沟通的机会是被身边的环境所切断的。
微信、QQ等社交工具和手机上的讯飞输入法都可以完成语音转文字的功能,但在音书APP 联合创始人彭驷庆看来,它们的使用流程都太复杂了,从打开到完成转换少说也得几十秒,更重要的是用户群体从一开始瞄准的就是健听人。
搭载了科大讯飞的语音识别技术的音书APP,定位是一款音与字互转的工具,针对听障碍人士的交流问题,近场和远场均可实现自由交流。在远场交流场景下,用户在音书打开的前提下拨打电话,对方的声音也可直接转换为文字,目前只有安卓手机可行。令人惊喜的是,只需听障碍用户本人使用安卓手机,而通话对方不作限制。
网络环境良好的情况下,猎云君尝试了音书APP的语音与文字转换,识别率相当高,应用到人与人的交流层面完成不是问题。 人工智能 发展的速度是快,但语音识别的抗环境干扰能力不强,尤其是听障人对周边环境的噪声判断能力基本为零,音书APP的远场交流会面临巨大的挑战。
“我们的算法团队正在集中精力攻克抗干扰难题”,彭驷庆的言下之意也是在等待人工智能技术尤其是语音识别的突破。
无市场推广的前提下,音书APP上线两个多月来,仅通过口碑传播,用户数量已接近10000,其中98%为听障人士。根据音书给出的数据来看,每天使用APP的用户不多,日活在10%左右,这恰好表明了听障人与外界交流的机会实在太少了。
出于提升用户使用率的考虑,音书讲在APP上添加其他功能,丰富用户交流时的可选择性,但不会向社交进发,在彭驷庆的眼中,语音识别走社交是没有市场的。
工具类的APP是第一步,音书正在研发的AR智能眼镜,可将说话者的声音实时转换成文字并在眼镜上进行显示,同时利用手势识别技术将手语转化成为声音,便于听障人士的沟通。软硬件相结合,音书想给国内2054万听障人士一个摆脱手语自由交流的机会。
目前,硬件已经完成了原型机的开发,预计年底进行小规模的量产,当然,在有资金进来的情况下,音书会跑的更快一些。
硬件开发上,音书还没有那么急迫,先做好抗干扰的研发,给听障人士一个可以简单交流的场景,已经成为公司的第一要务。
音书的创始人石城川,也是一位听障人,他从用户角度出发设计的音书APP,包括后续的硬件,或许最懂那2054万人。
产品:音书APP
公司:广州音书科技有限公司
网址:
www.voibook.com
解码人工智能·猎云网2017产业创新峰会 4月13日北京等你参加: http://www.lieyunwang.com/topic/summitai
289691