声网首创页面录制 实现音视频、白板、文字消息实时同步录制
伴随实时音视频逐渐成为当下主流的互动方式,声网的实时互动服务已经覆盖在线教育、 社交 直播、企业协作、IoT、医疗、 游戏 、保险等10余行业,100多种场景。而在教育、医疗、 金融 等场景中,用户不仅需要实时互动,还需要把互动的过程录下来,而开发者在接入稳定、流畅的实时互动服务的同时,对实时录制服务的要求也越来越高。
那么一个好的录制解决方案究竟需要具备哪些特征呢?
在回答这个问题之前,声网先来分析下客户使用录制的原因。一般来讲,用户使用录制功能的原因主要有三种:
1. 质检。 比如在教育场景下,需要通过回放录制来检查课程质量,在社交直播或金融双录场景下,需要保留录制视频,做合规性审查。
2. 留证。 如教育、医疗、音视频客服等场景,需存档留证以应对可能的纠纷。这种场景下,对录制方案的核心诉求是内容完整性,不能容忍哪怕是秒级的视频丢录。
3. 回放。 比如在教育场景、直播场景下,用户希望观看回放。
那么在这些场景下,怎样才算是一个好的录制解决方案呢?
我们可以从五个维度来衡量录制方案:
录制效果 :需要还原真实的互动场景,包括音视频、课件、白板、聊天信息等所有
元素。同时,不能对主播音视频互动体验造成任何负面影响。
集成难度 :越简单越好,最好是不需要开发。
等待时长 :等待时长越短越好,最好是录制结束后可以立即回放。
文件兼容性 :任何平台、任意浏览器都可以播放。
文件迁移的便利性 :文件下载、上传等迁移过程要非常简单,便于录制文件管理。
为了解决各种场景的录制需求,目前市场上有两种比较主流的方案。
方案一、音视频、白板等元素分别录制,然后拼接回放
主要思路是将音视频、白板、课件、PPT、聊天内容等分别录制下来,录制结束后再分别回放,并通过时间戳对齐播放进度。这种方案的好处是,白板、课件、聊天内容等均以数据形式回放,可以保留原有的真实互动效果,例如 PPT 可以单独翻页,灵活性较好。但其缺点也非常明显:
1. 集成难度大。 需要同时开发音视频录制、白板录制、聊天内容的录制,特别是各不同元素需要通过时间戳对齐回放,要做到非常好的同步效果需投入较多开发精力。
2. 播放兼容性受限。 这种方式只能通过特殊播放器来回放,无法很好地兼容主流播放器。
3. 等待时间长。 为了解决播放兼容性问题,往往需要在录制结束后进行离线处理,转成一个完整的 MP4 文件,这个过程等待时间较长,还会带来额外的转码成本。
方案二、本地客户端录屏
不管是本地客户端录制,还是通过屏幕共享将屏幕流发送到云端进行录制,其本质都是在用户的本地客户端上捕获屏幕内容。这种方案的好处是所见即所得,回放效果跟真实互动场景可以保持一致。但其缺点也很明显:
1. 影响本地用户的 RTC 互动体验。 本地捕获屏幕内容会极大地消耗终端设备的计算资源,如果要实时上传,还会占用主播上行的带宽资源,这些都会影响本地用户的音视频通话体验甚至会出现卡顿、模糊等严重的后果,这对一个实时互动场景来说是难以接受的致命缺陷。
2. 集成难度大。 开发者需要在端上进行开发,需要解决文件本地存储、上传等问题,往往还需要处理复杂的混音问题,集成门槛非常高。
以上两种主流的录制方面虽然各有优势,但对于开发者而言,不管是在集成方面还是录制的过程中都拥有多个明显的缺点。基于以上的行业痛点,声网首创页面录制,提出了第三种录制方案。
页面录制:集成简单,实现音视频、白板、文字信息实时同步录制
声网的页面录制是指通过 Web 页面渲染的方式, 在服务端同步录制音视频、白板、课件以及聊天信息等,还原真实的互动场景。其原理是:开发者通过 RESTful API 发起录制请求,并将待录制页面的 URL 以请求参数的形式发给 Agora 录制服务,Agora 录制服务会打开该Web页面,并以录屏的方式实时录制生成 MP4 文件,上传至指定的第三方云存储平台。
根据此前录制方案判断维度,将声网的页面录制与此前列举的两种传统的录制方案相比:
对比之下,声网的页面录制方案主要拥有四大核心优势:
在集成上,通过Restful API发起请求录制,简单易用。
录制效果实现所见即所得的,将音视频、白板、课件以及聊天信息等内容实时同步
录制,且不带来额外的带宽、性能开销,录制过程不影响任何主播/观众的RTC互动体验。
录制结束后,可以实时生成MP4文件,兼容各主流播放器。
文件下载非常简单,便于录制文件管理。
同时,页面录制具备录制任意网页页面的能力,所以用 WebRTC 或其它方案自研 RTC 功能的开发者同样可以使用。
目前声网页面录制功能已经被多家在线教育平台采用,而且目前声网的页面录制服务在2021 年 3 月 1 日之前都将免费对用户开放。