高延时与画面卡顿之下,清流鼎点要打破同质化远程视频体验

亿欧网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
高延时与画面卡顿之下,清流鼎点要打破同质化远程视频体验

受突如其来的疫情影响,在线办公,特别视频教学、视频会议成为全民热潮,但实践下来确远不如预期美好,众多 远程办公 族们发现不良的视频互动体验严重影响了办公、学习效果。

面对巨大市场需求,巨头们也纷纷瞄准了这个的新战场,钉钉、腾讯会议、字节跳动飞书和Zoom等,都从1月下旬起陆续推出了不同程度的免费服务。2月3日,“开工首日”的在家办公人数达近两亿之多。钉钉方面表示,当日早上9点,钉钉视频会议功能迎来历史流量高峰,造成网络出现短时限流。企业微信也称,全国数百万家企业使用企业微信线上办公,当日早上,企业微信的会议功能访问量激增,出现短暂限流。

远程视频为什么会“卡”、“慢”、“糊”?

然而,包括钉钉、企业微信、飞书在内的大量视频会议系统出现了不同程度的画面卡、慢和模糊的状况,运营方们表示这是由于突然提高的并发压力所导致——远程办公此前并非多数企业的标配,在海量并发下,都在使用初期出现大面积卡顿、掉线情况,只能紧急扩容云服务器以满足需求。

从专业的技术角度分析,其实服务器性能、骨干网带宽并不是决定视频通话质量的全部,接入网的状况往往更为关键,且软件算法也尤为重要,这些不是靠堆硬件、加带宽、部节点等工程手段可以解决的。

目前,国内的接入网络,并不如想象中的美好,密集的居住、办公环境决定了多个wifi热点之间的相互干扰是一种常态,而多人、多设备共享wifi则加剧了信道的竞争和拥塞。另外,越来越多的App使用自有传输协议,而为了改善体验,App们大部分都未遵循传统TCP协议所采用的退避机制,采用了一种以冗余为主要手段的发包策略。在这种方式下使用视频传输,使得10%-30%的丢包率开始变得常见,且丢包模型和延迟模型也都大大超出了实验室内的模拟预期,导致用户真实体验愈发的不理想。

目前业界也有一种观点认为卡顿对用户体验有着重要影响,但延时和质量则是可忍受的,亦有不少视频App采用大幅增加延时和降低质量等办法来改善卡顿。

音视频延时重要吗?  

延时的大小与用户满意度的关系到底如何呢?以下为ITU(国际电联联盟)出具的一组嘴到耳的音频延时与满意度关系曲线图:

高延时与画面卡顿之下,清流鼎点要打破同质化远程视频体验

从上图可看出,用户满意度与延时息息相关:

  • 延时高于550ms时,几乎所有用户都会对效果不满意;

  • 延时在390ms到550ms区间时,大多数用户都会对效果不满意;

  • 延时在280ms到390ms区间时,部分用户会对效果不满意;

  • 延时在150ms到280ms区间时,大多数用户都会对效果基本满意;

  • 延时低于150ms以下,所有使用者都对效果感到 满意。

而在教育——特别是语言教学、音乐合唱,还有远程驾驶与操控、AR/MR协作等领域,延时就不仅仅是满意度的问题了,而是会成为影响体验的决定性因素。 

很多人在期待5G,其高带宽和低延迟特性是否会使得视频体验问题迎刃而解?有媒体曾在北京移动中关村营业厅进行过实测,5G手机ping百度网站的平均延迟为16ms,而在wifi下则为5ms。同时,5G的信道频率远高于4G,因而信号相比4G会更脆弱,虽然传输带宽远高于4G,但传播损耗较大、覆盖范围较小、绕射能力较弱、丢包等问题也会更加严重。 

同时,随着5G的普及,4K、8K、VR等高质量、高带宽视频通信需求将逐步提升,这反而加剧了卡顿和延时问题。

高延时与画面卡顿之下,清流鼎点要打破同质化远程视频体验

 (ping测试截图)

技术方面如何应对?

如果从视频编码及传输关键技术的角度看,那应该如何去改进传输体验呢? 

目前国内外业界绝大部分App大多采用了Google的WebRTC开源方案,部分知名互联网公司也已放弃了已经自研了数年的技术,转投WebRTC。其中,部分厂商完全采用原生的WebRTC开源,也有部分厂商做了一定程度的定制和改良。技术的严重同质化,也导致了体验的同质化,软件 开发商缺乏独立求解的能力,只能寄希望于google对技术开源的释放力度。 

在音视频传输的研发阵营中,成立于2016年的北京清流鼎点科技有限公司(PowerInfo)则是其中的一股清流——公司一直在坚持自主研发,专注于实时视觉传输技术。

据介绍,清流的iLive视频传输方案在大部分网络环境下,从延时、卡顿和质量等维度,与WebRTC方案、微信等相比均有的优势(下文将表测试结果)。值得一提的是,iLive在保证流畅、清晰的基础上,大幅降低了音视频的传输延时,即实现了高可靠的低延时。

亿欧曾在现场采用“通话双方交叉数数”的方法来评估传输延时,在丢包率为1%的强网下,从1数到20,用人工秒表计时,清流iLive延时为9.8s,比微信(16.0s)低了37%、webRTC(17.0s)低了41%。在36%丢包率的弱网下,清流延时为10.9s,比微信(18.0s)低了39%、webRTC(23.0s)低了52%。而在不同网络情况,特别是弱网下,清流方案的流畅性和音视频质量也明显优于微信和webRTC。

这意味着不同的产品、技术,在实际使用中存在着较大差异,而这在远程教学、在线办公等场合有着很大的效率提升空间。

在另一次中美跨洋实际评测视频中,同样交叉数数1-20,清流延时12.1s,微信19.1s,webrtc是17.8s,而国际知名远程会议平台Zoom的测试时间为17.1s。 

清流iLive如何实现这些指标?

亿欧此前曾报道,清流鼎点创始团队均来自清华大学计算机系,在视频编码及传输领域有近20年的积累。团队告诉亿欧,“清流鼎点笃信技术改变世界,崇尚对视频乃至视觉技术进步的极致追求,更清晰、更流畅、更低延时,视觉无极限。”公司长期坚持原创、完整架构、分层开放的技术发展路线,核心技术、学术研究与产品化开发并重,服务于技术赋能行业战略。

2018年3月份,清流鼎点即推出了基于自有PTCP协议的端到端50ms的无线互联网实时合唱技术,同时还陆续研发了ARRC、MP、PDP、mobile-SVC、游戏数据传输、同步直播等多项创新技术,并于2019年Q3形成了Powerinfo iLive高可靠低延时解决方案,开始向包括中央电视总台和VIPKID等在内的行业客户提供技术服务

清流鼎点技术人员介绍iLive是从三个方向不断改善音视频传输效果的:

1、三要素整体建模

清流认为流畅、清晰、低延时是衡量互动视频效果的三要素,但在应用过程中,三者往往是互相影响甚至是排斥的,清流的iLive方案建立了从评估、预测到调整的三要素模型,并针对不同场景,进行基于大数据的算法和策略的优化。

2、全链路紧耦合优化

视频互动涉及编码、传输、转发、解码等多个环节,各环节又分为多个模块和层次,清流鼎点的iLive将它们视为一个整体,进行综合优化,而非各自为战。当然,这需要多年、全栈的技术和知识积累。

3、科学与工程结合

同时,在每个工程环节追求极致,以ms为单位一个一个地去突破,去降低延时,在海量的测例中,去分析和发现问题。这种工程上的极致追求,也是效果提升的重要推动力。 

在这种理念下,清流鼎点通过多年技术积累并开发的iLive,在高可靠低延时传输领域(200-500ms)较其他技术有较大优势,而在100ms以内的超低延时领域,清流iLive几无对手。2018年Q1,清流实现了在普通wifi网络、普通终端(iphone手机)、普通云节点上的50ms延时的在线合唱;2019年Q3,清流将延迟降低到了40ms,实现了在线乐队的合奏。

 另一方面,近期在音乐教学领域一款比较火热的工具类视频互动App「直面(视频零距离)」便是基于清流iLive技术孵化出的,其APP尚为内测版,但由于疫情影响而开始被更多用户采用。直面的特点除了具备iLive的高品质音视频体验以外,产品界面、交互也较为简约,内测版也已具备大部分功能, 用户使用过后将会得到与传统视频软件不同的体验。

版权声明

本文来源亿欧,经亿欧授权发布,版权归原作者所有。转载或内容合作请点击 转载说明 ,违规转载法律必究。

随意打赏

提交建议
微信扫一扫,分享给好友吧。