远望资本程浩:我为什么投资音频信息流“随身听”
2018年第一季度全球智能音箱出货量920万,未来语音交互将是一个巨大的市场,这是一个不争的事实。我自己买了Amazon的Echo和小米的智能音箱,虽然技能还不是特别丰富,但是体验都超出我的预期。
既然语音交互是一波大趋势,那么创业和投资机会在哪里?我们做了深入思考,并对比了手机行业。智能手机这一波,其实投资手机制造商的机会不是特别多,更多的创业和投资机会在于App,特别像微信和TMD(头条、美团、滴滴)这样的杀手级应用。智能音箱非常类似,现在做音箱的全是巨无霸,BAT小米这种量级的,创业公司做音箱太难了。
所以我们认为主要的创业机会是在其上做Killer App(智能音箱管这个叫Skills),也就是做智能音箱的微信和TMD。显然,我们认为听新闻是一个刚需高频的事情,而且不光局限在音箱上,手机(小程序)和车载也可以,你每天早上起床可以听,做饭的时候可以听,外面走路的时候可以听,开车的时候也可以听,场景非常丰富。
当然很多人都会问音箱厂商都会有自己的官方新闻Skill,第三方的有戏么?没错,手机厂商也都有自带的新闻APP,你不是还用头条和腾讯新闻么?这是个强运营的活,而且技术含量不小,包括网络爬虫、清洗、摘要提取、语音合成、推荐系统等等。
随身听的创始团队来自于百度大数据和腾讯AI的高级产品经理,对预测系统、语音交互以及智能设备有非常丰富的经验。同时极具创新精神,在百度期间参加百度Hackathon大赛并获得第一名。整体而言,团队的基因和这个事情非常相符。
以下为源自36氪资深分析师石亚琼撰写《做语音新闻聚合推荐平台,「随身听」获远望资本数百万元天使轮融资》的详细报道:
36氪获悉,语音新闻聚合推荐平台 “随身听”已完成数百万元人民币天使轮融资,由远望资本投资。本轮融资将主要用于团队扩充和内容丰富。团队希望在短期内优化机器生产的内容质量,丰富内容品类。长期目标是做内容分发平台,接入更多第三方内容。
“随身听”是一个语音新闻聚合推荐平台,团队以自研的舆论预测算法和文章摘要抽取算法,为人工智能语音交互平台客户及个人用户提供语音资讯服务。
“随身听”更像是一个利用机器提升内容生产效率的内容生产者。“随身听”的内容并非来自于网络抓取,而是通过算法自动生成。这使得公司在未来不会面临版权问题。
要做到这一点,主要利用了网络爬虫技术、数据清洗、知识图谱、自然语言处理等相关技术。具体来说,通过网络爬虫模块,每天大概爬取到2-3万条全国各地的新闻资讯及相关平台、作者、评论信息,并对这些内容进行关键信息提取构建信息图谱,去重,过滤敏感信息和谣言,并进行排序;分析文本中句子的重要性,进行抽取,确定时间、地点、人物、事件等基本信息,生成摘要;并通过语音合成生成语音内容。
一般来说,只有头部内容才能获得更多的关注。这方面,团队通过技术实现新闻热度预测。团队通过抓取阅读、评论、转发等用户行为数据及其变化趋势,和平台本身发布、置顶、推送、下线等行为动作,通过机器学习建模,实现对新闻热度的预测。目前,针对头部内容团队会进行人工录制。
在国内,内容的审核必不可少。目前团队主要通过人工来完成。一方面, 新闻编辑员对自动抽取内容进行评估和修改,同时修改内容反馈抽取模型和热度预测模型,训练模型参数。另一方面,新闻审核员会负责审核新闻的内容质量并政治脱敏,屏蔽风险。
目前,“随身听”的产品主要以语音内容的形式对外提供。这意味着团队在技术上还需要解决语音合成技术,从而降低内容生产成本。团队表示,目前团队已经积累了很多新闻主播的新闻播音数据,并标注后做新闻播报领域的专业TTS库,比现在开放的通用TTS效果好。现阶段,“随身听”的头部新闻也采用人工录制,长尾新闻采用TTS合成。
现阶段,“随身听”同时向C端、 B端提供内容资讯服务。C端方面,目前主要通过小程序、App呈现,团队表示上线一个月自然用户在5千左右。B端方面 ,以接口的形式向合作伙伴输出内容,目前已经与腾讯、小米、京东、地平线等建立合作关系,按照年费或者接口请求收费,目前公司已经实现了盈利。
此外,为了提高用户粘性,团队还通过机器学习等技术, 为用户建立用户画像,首次登录给用户选择感兴趣的内容标签,系统会记录用户对新闻类型的收听行为,详情TTS的收听情况,以及跳过或重听的行为,建立用户画像,从而筛选用户喜好的标签,筛选出用户最有可能喜爱的新闻内容。
当前,音频内容的接受程度越来越高。一方面,生活中确实存在诸如驾车、骑车、步行、家务、用餐、洗簌等不方便观看的场景;另一方面,也存在下班疲惫、年老眼衰等不愿意看或者不能看的场景,给音频内容提供了机会。而随着智能音响、无线耳机等音频终端普及,智能语音相关的巨头及初创公司之间形成竞争,音频内容的重要性也在提升。
新闻资讯类应用及服务往往门槛相对较低,且前期需要借助渠道推广,很可能面临后来者竞争。团队认为,新闻是数据驱动型项目,目前即使是渠道型的大公司,在新闻的数据化和实效性方面积累并不够强。
“随身听”有10人左右的全职团队,创始团队是百度大数据的技术和腾讯产品经理的组合。创始人汤巍敏,2014年初加入百度,在百度云设备部和百度大数据部任职,获近30个中国和美国的专利。联合创始人宋治云曾任百度智能语音产品经理,腾讯AI高级产品经理。核心成员在新闻预测、个性化推荐、语音交互等方面经验丰富。团队曾参加百度hackathon比赛,获得黑马奖。
远望资本创始合伙人程浩告诉36氪,“ 语音交互是一个趋势,而个性化的音频新闻是建立在语音交互基础上的杀手应用,既刚需又高频,可以应用在音箱、车载以及手机上;特别是手机端还有微信小程序的红利。其次,从团队配置上看,这是一个百度大数据的技术派和腾讯AI产品经理的优秀组合。”