深度对话融云:从WICC大会百家争鸣,看风口之下音视频社交的三大新机遇
摘要:增长趋势会逆流吗?合规难题怎样解决?中小厂商如何入局?市场机遇转瞬即逝,怎么快速上车?音视频赛道的核心问题都在这里了。
年初 ClubHouse 的爆火引起了不少行业玩家对语聊房模式的复制热潮,也带来了音视频 社交 的一波爆发式增长。基于行业新风向, 互联网 通信云技术服务商——融云,在今年 WICC 大会进行了一次大胆的革新。
11 月 20 日,融云主办的全球互联网通信云大会 (WICC) 在广州召开。不同于往届专注 PaaS、IaaS 层技术研讨,今年融云邀请到 Unity、Beeto、StarMaker、LiveMe、积目、荔枝等多个社交泛娱乐领域的全球化厂商齐聚一堂,从海内外市场特征、技术实现与创新、内容合规、未来趋势等多个角度进行了更加贴合场景业务的深度探讨。
会后,扬帆出海特别邀请到融云 COO 董晗,针对此次 WICC 大会上音视频社交的话题观点进行了专访。董晗表示,此次 WICC 与出海厂商们进行了一次非常透彻的探讨,结合融云多年服务出海开发者的经验,可以看到音视频社交领域的一些新趋势。
“最近关于 ClubHouse 缺少变现渠道的新闻,让不少人对音视频社交的前景心生忧虑。但基于与开发者的沟通和对国内外市场的分析观察,我们认为这个增长趋势是不会逆流的。如今我们的通信技术已经处于国际领先水平,在融云这样的服务商赋能下,很多开发者已经成功摸索出自己的业务模式。尤其是在出海业务上,音视频社交依然大有可为。”
增加“轻量级社交模块”是趋势
近两年,在“视觉 经济 ”被推上极致的同时,“耳朵经济”也以后来者的姿态迎头赶上。“在我看来,疫情之下,音频的属性特征成为‘耳朵经济’崛起的重要原因。首先,语音对话是人们最自然的交流方式;其次,音频具有‘伴随性’特征,可以一边听一边做其他事;另外,音频相比于视频,对带宽的要求更低。除了单向输出的电台模式,我们发现音频场景下的互动趋势越来越明显,互动播客、语音陪玩、多人语音聊天等各类玩法异军突起,成为陌生人社交的新风口,吸引大量企业入局。”
基于融云丰富的语音社交领域服务经验,董晗详细介绍了她所观察到的一些行业变化。
“作为音频社交的一种,中国的语聊房业务更偏向于社交娱乐场景。不过,最近语聊房在属性和玩法上有了一些新的趋势。比如,之前大多社交娱乐类软件都是单纯做语音社交;而现在,除了社交娱乐类软件,工具类、生活类、 汽车 类、酒店类、旅行类等各种软件,都会增加语音社交的功能,把它当作一个必不可少的‘社交模块’。”
另外,不同的社交场景在 APP 用户增长及变现中所承担的角色不同。董晗解释道:“比如从变现能力来说,1v1 聊天场景用户的付费意愿更高,但并不是所有 APP 都有能力用这种重度社交模式留下用户。所以,我们看到这样的现象:很多 APP 会在主流服务基础上增加直播、语聊房等模块,这样可以用更轻量级的社交调动用户活跃度,进而向重度社交,乃至付费变现导流。通过多种社交场景的叠加,可以增强 APP 的用户粘性和变现能力,这也提升了他们对通信云技术的需求程度。”
事实上,正如董晗所言,如今语聊、直播越来越“轻量化”,为了提升用户粘性,大部分 APP 都在渗透社交。然而在这样的趋势下,厂商的运营能力和开发能力也在面临比较大的挑战。
“这其实也是我们把语聊房、直播等场景都做成 SDK 提供给开发者的原因——‘开箱即用’的场景化SDK帮开发者解决了通信和功能实现难题,开发者得以把更多精力和时间用于玩法创新和运营上。”
近期,融云语聊房 SDK 2.0 上线。作为业界首个完全基于场景化的 SDK,不同于行业普遍存在的基于开源代码的二次开发服务方式,这个SDK直接封装了场景功能,让开发者通过调用不超过20个API,就能实现一个语聊房,最大限度地降低开发者的研发成本。
据董晗介绍,实操过程中,通过融云语聊房 SDK,开发者可以在 30 分钟内快速构建出一款语聊房产品,并且可以申请软件著作权实现上架,保证整个产品的运营节奏。
AI、5G将给语音社交广阔“空间”
面对当前的语音社交大热趋势,中小厂商该如何在同类产品中脱颖而出?结合 WICC 广州上的话题探讨,董晗给出自己的答案:
“我个人的建议是,非社交类APP在顺应‘轻量级社交模块标配’趋势的同时,可以关注一下语聊房内交流内容的运营。要让内容更加垂直化,话题更具稀缺性,主题更符合 APP 特性,而不是纯娱乐、发散型的,让这个功能模块在各类APP中焕发出更大的活力。”
董晗表示,对于想要破局的开发者来说,关键在于有更新的玩法以及快于同行的开发速度。要快速形成自己的产品,并投入市场试水。融云场景化 SDK 就是为了满足开发者的这一迫切需求。
从技术的角度出发,关于语音技术的几大发展方向,融云也有自己的洞察:
第一,空间感和沉浸感。这也是最近兴起的元宇宙比较强调的概念。正如视觉上,虚拟场景里正在向三维拓展,语音也在以提升空间感和沉浸感的方式向三维方向发展。
第二,交互中的多语言处理。语音交互最为自然,但全球化语境下多语言不互通是语音社交的壁垒。通过AI的同声传译,这一问题相信在未来5-10年内可以被解决。
第三,未来的人机交互。现在人机交互还停留在指令识别阶段,在不远的将来,我们将可以实现完全的人机语音交流,甚至跟不同类型的机器人聊不同的话题。
“总体来说,语音一方面要解决沟通的问题,一方面要趋向‘身临其境’。未来除了立体声听音乐之外,实时语音交互也会走向空间体验。随着AI、5G甚至6G的未来发展,还会有很多新场景出现。前景很好,技术纯熟,只待时机。”
攻克“通信周边”难题成业务刚需
在国内互联网企业纷纷出海的大趋势下,融云也早早随着服务客户的脚步走上了全球化发展之路。在这个过程中,融云一方面全力帮助客户攻克出海遇到的通信技术难题,另一方面也不断总结各个海外市场的本土特点,进一步强化通信周边服务能力。
“经过几年的努力,我们的通信底层基础设施已经做得非常好,例如‘最后一公里’的质量问题早已被我们攻克,能够确保全球范围内的通信低延迟、高到达率。而除了通信问题,出海业务也必须解决与本土化适应相关的‘周边需求’难题。”
周边需求主要有两个方面:
一是文化国情差异,出海客户面临的是与国内完全不同的市场环境,有更高的复杂性。
“比如,非洲地区有个问题——用户下载及更新APP的成本很高。我们建议非洲市场客户尽量采用H5的方式去更新APP,不要让用户自己重新下载。”这是对通信服务全平台适配度的考验。
“再比如,有些国家习惯于从右往左书写,那我们提供的SDK在UI设计等方面要适应当地这样的习惯。”这是对通信产品丰富度的要求。
二是内容合规难题,由于各个国家政策法规、宗教信仰、风俗文化不同,相应内容审核的要求差别很大。在内容审核上,董晗特别提到了“音频识别”技术。“不同于视频可以抽帧成图片去识别,声纹有众多变化,如何精准识别?一旦用户的行为发生变化后,技术能否实时更新快速跟上?”
董晗表示,针对合规这个线上业务“老大难”问题,融云与业内多家专业内容审核平台达成了合作,为开发者提供多种可以一键配置的选择。无论是图文还是音视频,都能够以SDK集成的方式提供最优解决方案。
类似审核这样的非通信核心但却是业务刚需的周边能力,融云还打通了很多。这正是融云提出的“IM+RTC+X”战略升级内容,在 IM和 RTC 双核心能力之上,把美颜、变声、虚拟背景、审核、推送、聊天机器人、文字翻译、地图、语音转文字、表情、红包、CDN、白板、SIP、版权音乐等多种通信周边能力整合到一个SDK中,且适配 Electron、Mini Program、Windows、Linux、Flutter、React Native、Unity、uni-app 和 H5 等全平台系统,确保多端、多平台的相互兼容。
这将极大减少开发者的工作量,省去开发者自己逐一对接第三方厂商的功能、代码以及价格的过程。“我们会有一线高阶研发人员帮开发者选型:在不同国家和地区,哪家服务商更好,抗压、并发、识别准确度更高,整合各家所长为开发者服务。”
最后,董晗表示,融云希望提供一站式出海解决方案,从底层架构、到安全合规、再到本地化适应的全程技术陪伴,如全球通信网络、全球数据中心、内容安全、隐私与数据合规、多语言支持、文字语音翻译等,助力开发者在海外市场开疆拓土。