音乐雷达,能像语音识别搜索应用shazam一样吸金吗?
给app听音乐,帮助识别出歌名等信息,这样的应用,想必大家已经不陌生,像国外的shazam、soundhound,国内的百度哼唱、qq音乐、酷狗音乐、微信摇一摇的音乐识别功能,还有海豚浏览器和香港缪斯娱乐也合作推出的“ 音乐猎手”。另外,还有索尼手机自带的trackid。但是,shazam、soundhound在中文歌曲的支持上都明显不如英文歌曲;qq音乐、微信摇一摇目前只支持原声外放音乐的识别,对于哼唱搜索就不是那么给力了。trackid就更缺乏一点灵活性,只能识别以前录制的音乐,不能识别实况音乐、歌声、嗡嗡声或歌曲请求,使用场景上可算是与以上其他应用完全是两个类别。
“音乐雷达”是王磊从盛大技术研究院出来创业之后推出的音乐识别产品,2013年1月推出android版,近期又推出ios版本。做了一下比较,这款产品在中文音乐识别搜索上比shazam、soundhound这些国外产品更多、更快,和国内几款产品相比,支持哼唱搜索。王磊介绍,在下一个新版本中,还将加入念歌词搜索。
音乐雷达的android版目前支持音乐的完整试听和下载,因为这部分曲库收录的都是128k以下的音乐,按照现在的通行做法,这种音乐被称为低品质音乐,大多可以免费下载。据王磊介绍,音乐雷达的曲库现在已经收录几千万首音乐。而ios 版由于版权问题只支持 30 秒试听,不支持下载。
音乐识别的技术原理,简单地说就是,采集声音样本,通过网络将音乐信号发回到数据库,经过数据分析,再将该乐曲的相关信息发回到用户手机。音乐雷达有自己的专利技术。
王磊在中国科学院自动化研究所,获得语音识别专业博士学位,2008年代表自动化研究所参加在费城举办的mirex 2008,这是在国际音乐检索方面最有影响力的赛事,并在哼唱音乐检索评测获得第一名。之后在理光软件研究所负责语音识别系统的研发。后在新东方开发出了新东方在线语音口语评测软件,解决了用户自学外语时口语水平无法得到及时反馈的问题。在腾讯还主导开发了一套音乐内容自动分析和标注工具。在盛大创新院工作期间,他发布了国内第一款开源的哼唱检索系统,并作为项目负责人开发了音乐检索产品。王磊介绍,音乐雷达目前拥有全球最大哼唱搜索数据库和全球最大的音频指纹数据库。2012年这款产品获得世界音乐信息检索评测(mirex)第一名。
目前,音乐雷达目前也向第三方开发者提供相关的 open api 服务,开发者和合作方通过音乐雷达提供的 api 接口就可以享受现成的音乐识别和分析的服务。这一点与开放源码音乐识别应用 echoprint颇为相似,而shazam 提供的则是封闭源码。
在收入方式上,国外产品首先是来自于音乐。shazam目前已经有3亿用户,去年的收入也达到3亿美元。在音乐方面,shazam的收费方式有付费订阅,还有与 itunes、亚马逊相连的广告和推介购买分成。
在国内,数字音乐收费显然不如国外那么现实。目前,音乐雷达最触摸可见的收入是来自与运营商在付费彩铃上的合作。电信运营商每年在付费彩铃的下载上,每年收入有几百亿的规模。音乐雷达的方式是作为第三方平台为运营商的彩铃服务导流量,以从彩铃下载中分成。
数字音乐收费虽然还不明朗,但去年关于数字音乐收费的讨论就已经非常热烈,阿里巴巴、腾讯、百度等也早早在此领域布局。这部分的商业化也还是可以期待的。王磊介绍,音乐雷达目前已经有多个语言版,也会考虑先将音乐雷达和亚马逊等平台对接,从其音乐销售中分成。
但显然还不至于此。语音识别是未来的趋势,soundhound的创始人和首席执行官keyvan mohajer曾表示过, “目前我们只涉足了音乐这个垂直领域中……但我们认为,市场将会对依赖语音识别的计算设备产生重大的需求。”显然,shazam在践行这句话方面走得更远一些,也让同类产品在商业化方面看到了巨大的“钱景”。
2012年, shazam从音乐识别转向了电视节目识别,将侦听技术识别用于电视广告互动。据 shazam公布的数据,使用电视广告互动获得优惠券的用户转化率在27%左右,这也成为shazam一个主要的收入来源。
在大数据时代到来的背景下,rtb(实时竞价)广告的火爆也许可以解释shazam在互动电视方面的成绩。有研究表明,在未来几年rtb广告迎来一个变态的上升曲线,达到千亿美元级别。而在国内,目前只有8%的企业尝试过rtb,这还是一个巨大的市场空白。从技术原理上讲,音乐识别和互动电视等的底层技术是相通的。王磊说,音乐雷达也有这个技术能力,不排除会做音乐之外的拓展。