用了深度学习,CastBox做了一个播客版的「今日头条」-36大数据
作者: curator
你已经有多少年没听过广播了?
是否还记得当年上学的时候,不能看电视,不能玩电脑,广播里的直播节目和音乐节目陪你度过了许多的夜晚。
这两年,随着荔枝FM、蜻蜓FM、喜马拉雅等 App 的火热,许多人以 Podcast 播客的形式重新找回了听“广播”的习惯。
但是,Podcast 和广播总还是不一样——它不能无限听下去,也不会自动向你推荐新的节目。当音频节目越来越强丰富之后,为了找到自己喜欢的节目,不得不花精力去大海捞针。
于是,就有了这样一个 App 决定利用 Google 的开源人工智能框架 Tensorflow 和音频节目结合在一起,打造一个音频版的 Netflix——它的名字就是 CastBox。
CastBox 是一款免费的播客 App ,收录了全球 130 多个国家和地区 5000 万个音频节目,用户绝大部分在海外。CastBox 2016-2017 年连续两年登上了 Google 年度的应用大奖名单。
CastBox 的创始人王小雨曾就职于 Google,在 Google 北京、爱尔兰、日本三个办公室都工作过,帮助 4000 多位不同国家和地区的开发者在全球市场进行移动应用的流量变现。
今年 8 月的 真格基金“创业路上的产品设计”分享会 上,王小雨表示:“这份工作使得她能够在不同时区和地区看到很多已经被验证的成功的商业模式和运营方法,这些成功的经验完全可以在另一个时空下被复制。”
王小雨就职于 Google 期间接触到的很多数据,让她意识到播客是一个极具潜力的市场,并且行业内还没有出现巨头——苹果的 iOS 平台上有自带的播客应用 Podcast,而 Android 平台没有这样同量级的播客App。离开 Google 后,王小雨先以 Android 系统为重点开发对象,后续再开发、完善 iOS 版(CastBox 目前已有 iOS 和 Android 版)。
凭借着某种程度的先发优势 CastBox 已经覆盖了全球130多个国家,目前 CastBox 的用户量已经达到了 700 万,其中 30% 的用户来自美国。而同类竞争者 Pocket Cast 的用户量在 100 万左右。
苹果的 Podcast 在 iPhone 上的用户量在美国同类应用中占 40% 的比例,而 CastBox 目前已经是 Android 端下载量最大的播客类应用。
CastBox 与其他播客 App 最大的不同是基于机器学习的个性化内容推荐
在手机上,每年都有许多新播客 App 上线,播客本身也并非今年才流行起来的新概念。为什么 CastBox 会有“先发优势”呢?
原因和今日头条之于传统新闻客户端差不多,CastBox 是目前少数淡化订阅模式,以推荐算法驱动的播客 App。
CastBox 与喜马拉雅、荔枝FM 等播客 App 最大的不同主要在于,CastBox 使用了 TensorFlow(Google 开源的机器学习框架)对用户偏好进行分析,从而提供个性化的推荐。
TensorFlow 最初由 Google 机器智能研究部门的 Google Brain 团队中的研究人员和工程师开发的,用于进行机器学习和深度神经网络研究,TensorFlow 的通用性使它也可以应用于众多其他领域。
TensorFlow 目前已开源,在 Github 上就可以下载到 TensorFlow。目前 TensorFlow 中国下载量已超14万,清华大学自然语言处理实验室的研究人员已通过 TensorFlow 来加强他们对语言理解的研究工作,京东、小米等公司也在使用 TensorFlow。
除了在 Github 上可以下载到的 TensorFlow,Google 还发布了 TensorFlow Light,针对移动设备进行了定制化,在智能手机等设备上已经可以用到 TensorFlow。
另外,Google 内部用的 TensorFlow 和开源 TensorFlow 是完全一样的。Google 内部对 TensorFlow 的改善,会一周多次和GitHub做同步,保证所有人下载的 TensorFlow 跟 Google 内部的 TensorFlow 保持一致。
TensorFlow 也应用于 AlphaGo:TensorFlow 是 AlphaGo 这个系统底层的支撑技术,TensorFlow主要的贡献是更多的让这个系统运转更加的流畅、速度更快。而 AlphaGo 本身在围棋方面技巧的提升,更多的还是 DeepMind 团队通过更多的培训、更多的训练,以及算法的升级。
CastBox 的 CTO 贺晓聪表示:“TensorFlow是一个大的框架,CastBox 主要用到了它深度和广度的特性,具体的算法我们在 TensorFlow 的基础上有自己开发。在 TensorFlow 的框架里,你可以制作很多种算法去实现自己的目的。此外,机器会自己学习,越学推荐的越好。”
实际的运营数据显示,在搭载 TensorFlow 推荐算法之后,CastBox 的用户平均订阅量增长了一倍,用户留存也显著上升。而和自己研究推荐算法需要多人团队相比,CastBox 仅新增了一名在相关领域拥有博士学位的员工专门负责算法的调教。
CastBox 的推荐机要从 5000 万内容中进行搜索推荐,为了确保推荐的准确性,CastBox 为这套算法加入不同影响因子:
一开始先根据用户的国家、语言、最初打开 App 时选择的兴趣爱好推荐内容,再通过用户的订阅量、打开退出数、收听时长等影响因子做进一步的推荐优化。
除了用户对播客内容的点击率,CastBox 还加入了播客的完结率(是否听完了)、分享率、订阅率以及复听率,加上机器学习的优化,提高内容推荐的准确性。此外,CastBox 在训练机器的过程中会告诉机器要将 CTR(Click-Through-Rate 点击通过率)高的推荐给用户。
作为一家中国出海企业,CastBox 在使用 TensorFlow 的过程中并没有感觉到什么障碍。
技术上遇到的一些问题,CastBox 通过邮件与 Google 官方取得了联系。Google 内部有很多邮件群组,包括 GooglePlay 也有跟开发者互动的群组,能够及时回复开发者的邮件。
此外,Google 在北京,也有一个专门的开发者关系的团队,能更多的给一些手把手的帮助和支持。
作为一个出海企业,和用户沟通成了最大的挑战
CastBox 的公司规模不大,至今的人数不到 40 人,能够在市场中占据先机,除了对 TensorFlow 的利用之外,最大的竞争力来自于对市场的快速响应。
CastBox 开发团队与用户沟通的渠道主要有两个:一是 Google Play 的评论系统,二是邮件往来。贺晓聪表示:大部分用户评论都会在 24 小时内进行回复。
王小雨在真格基金分享会上表示:“CastBox 的第一版,从着手开发到产品上线只用了 3 天时间,是我自己写的。如果现在把我们的后台拉出来,会发现每天都会有一个小的版本上线,每周都会有一个大的版本更新,每两周都会发布全新功能。有一次,一个美国用户早晨给我们发了一封邮件,抱怨说产品没有某个功能。到了晚上,这个用户又发来了邮件,说不好意思,我已经找到了这个功能。其实真实情况是,我们在收到邮件后(当时是北京的晚上),花了一个通宵的时间把这个功能写出来了并上线,所以美国用户到晚上(北京的第二天早上)就用上了这个功能。”
贺晓聪则表示:“我们团队有一个人是每天都会去 Google Play 上面看评论。上次是有用户要求加一个排序的功能。有个用户对我们的排序功能很不爽,他说他喜欢有能倒着排序的功能。当天他提完之后第二天我们就给他发了一个测试版本,让他先测试一下,如果没有问题我们下个版本就会上线。基本上我们是24小时就给他发了一个回复,这个好像是欧洲的一个用户提的要求,是一个对功能非常深度的要求。”
针对130多个国家不同的功能需求问题,贺晓聪表示:“我们天天看评论,Google Play 也会有一些分析报告,哪些用户是因为哪些问题给你的评分很差,有哪些功能给你的评分会高,我们天天会看,每一个评论我们都会去看,如果说话我们真的不懂什么意思,我们会在里头给他留言,让他把问题发给我们邮箱或者留个邮箱我们再来跟踪一一说清楚。有些用户特别好,他会跟你说1、2、3、4、5好多条,我们也会给他一一回复,告诉这个大概是什么时候发,那个大概是什么时候发。这个确实是真正去做的时候比较枯燥比较累的一些活。”
面向 130 个国家提供服务,还意味着 CastBox 面临着巨大的审核压力。与想象中的不同,CastBox 并没有建立一支庞大的审核团队,而是先用人工智能的语音识别框架将语音节目转换成文本,再用一些公开的库去将其中带有文化禁忌、色情暴力的内容删除。
CastBox 在 Google Play 的下载量已超过七百万,每日活跃用户超过百万。用户平均每天打开 5 次,每天花费在播客上的时间平均为两小时,大部分用户在上下班、开车的时候收听播客,用户画像主要是 25-34 岁,男性为主。用户留存率在 60-70%。CastBox 近期已完成了A轮融资。
目前,CastBox 在美国成立了市场团队,主要负责播客版权的合作。下个月将会推出付费订阅的功能,付费方式是 Google Play 本身就有付费订阅的机制,订阅的内容主要是针对于一些有版权的资源。
王小雨表示:“付费将会是 CastBox 以后的主流,成为我们收入的主要来源。”
End.
转载请注明来自36大数据(36dsj.com): 36大数据 » 用了深度学习,CastBox做了一个播客版的「今日头条」