关于微信 The Voice Donor 项目
The Voice Donor 是由微信发起的「为盲胞读书」的公益活动。用户只要进入「为盲胞读书」(微信号:voicedonate)的微信账号,就可以朗读系统推送的一段文字;或者随手拿起手边的书,为盲胞朗读自己喜欢的段落。后台将收集语音文件,制成有声书,提供给盲胞收听。
微信 TVD 是如何运作的
创意从何而来?
我们先做了一个前期的调研:在中国 1263 万视觉障碍人士,这个数字是新加坡人口 2.5 倍,中国每天新书上架数量是 700 本,但是盲人阅读的数量是零。我们通过计算发现,以目前微信 3.96 亿的用户量来计算,即使每个用户捐献一分钟也是一个非常庞大的语音库。于是我们就想,为什么不用微信的语音功能做一些有意义的尝试呢?创意就在这里产生了。
在具体打磨创意过程中我们主要遵循三个原则:打破常规、跨界融合,极简主义。微信的语音功能是移动互联网与人声的有机融合,用户拿出微信就可以成为声音的捐献者。同时我们在后台做了很多复杂的技术尝试,从而把最简单的交互呈现给用户。好的创意也带来不错的传播效果,整个一周之内就达到了千万量级的曝光。
TVD 的运营和推广
好的创意是第一步,运营推广也很重要的。我们选取了盲人按摩院和闹市书店作为推广的主要试点。首先,我们了解到盲人按摩是盲人从事最多的行业,也是盲人与普通人接触最频繁的地方,所以在按摩床下设立二维码正是基于这样的考虑;其次,闹市书店是人们阅读的高关注场所,更便于随手进行阅读分享。
关于传播前期我们并没有做主动的推广,因为我们对这个创意有足够的自信,希望凭借自动的传播让大家参与活动当中。TVD 上线时恰逢 5.18 全国助残日,为盲胞读书的项目在微信朋友圈中火了起来,进而扩散到其他的社交媒体,成为口碑传播的裂变效应。我们还会发挥腾讯平台的优势,比如联合腾讯文学给我们提供一些独家的内容资源;同时借助社会力量如专业的盲人机构收集用户的声音发放到盲胞的手里。我们希望让每个微信用户都成为一个志愿者。
TVD 的技术实现方式
如何筛选?
系统会从一段文本对应的一些语音中选取一条出来,要求该语音流利清晰、没有误读漏读和多读的情况。分析筛选的过程主要按照两个维度来进行:
- 基于时间点:通过语速、是否停顿和漏读多读,给出流利度得分;
- 基于置信度:检测是否错读、口音和噪音,给出置信度得分。
通过这两者的综合分析,系统最终会确定选择哪一段语音传达给盲胞。这背后是一整套基于专业声学模型的技术手段来进行支撑。
技术尝试
我们也想过采用更简单的方法。首先自然就是语音合成,不需要很多人参与,直接合成语音就行。但是这里存在着问题,比如说语音不够自然,感情不够丰富,声音过于单一,所以我们就砍掉了语音合成的方法。另外还有降噪的问题,我们从互联网上采集的语音太多样了,有的在汽车旁边,有的在家里。
所以未来对 TVD 的改进主要从这几方面展开,首先是改进分析模型,另外一方面是改进我们的算法,未来还可以引入打分评价的方式给用户更多的反馈。
(本文根据腾讯微信 TVD 项目经理梅舰和模式识别工程师岳帅在 MIIC2014·极客公园公开课的演讲整理)