声网认为,实时技术已“突破前夜”| WISE·2016企业服务峰会
今天下午,声网Agora.io CEO赵斌受邀在36氪主办的“WISE·2016企业服务峰会”分享了他对实时互联网技术的思考。
根据Forrester Research的报告显示,未来两年内,美国实时视频的使用量会增加135%,而在中国这个数字将会是250%,实时互联网技术迎来发展的春天。对于实时互联网技术在中国的发展,赵斌有以下几个观点:
实时互联技术已经进入“突破前夜”,进入线上经营模式
随着智能机的普及、4G网络的普及,实时互联网技术已经进入“突破前夜”的关键节点。最直接的例子就是当前大热的直播经济,视频最多只有2-3秒的延迟。而在过去,视频影音这类内容是先由生产者生产、上传到互联网之后,消费者才能看到,这中间就存在一个产生和消费的延时。实时互联网技术的应用,可以减少甚至消灭这种延时。
赵斌认为,实时互联技术已经开启了线上经营的未来发展模式。赵斌以声网的服务客户为例,介绍了实时互联技术在不同行业的具体应用:Marco Polo (视频留言)、联想智能眼睛C100 (Filed Service 实时现场服务)、Talk Space(实时在线心理咨询 )、去哪儿(智能全渠道呼叫中心)、智能座机、bolome (实时电商直播)等。声网为这些应用提供了稳定高质量的视频语音通话的技术保障。通过声网提供的技术,这些应用为用户在不同的场景下提供了更加方便和快捷的服务。
我们需要更“实时”的网络帮助视频内容的全球传播
实际上在互联网泡沫的第一代阶段,硅谷就曾出现了一批实时音频或者是实时音视频的创业公司。但是由于当时的互联网的基础设施和环境条件限制,技术的成熟度不够,所以无法保证用户体验,这也是为什么后来很长一段时间内这方面技术并没有什么大的突破。
赵斌介绍,为了给用户提供稳定的技术服务,声网在全球范围部署了一个虚拟网解决这个问题。然后在这个虚拟网上,建设基础设施和服务,把实时的音频、视频以及互动直播,打包成最简单的API,提供给开发者。声网最基本的使用模式,四行代码就可以实线。
声网创建到现在不到三年,目前已经积累了几万开发者,通过实时的音视频服务,连接了3亿以上的终端,每天在几百个国家都有实时音视频传输的服务使用。
准备好下一个创业突破机会
赵斌介绍的最后一个观点就是要准备好下一个创业突破机会,从场景、技术和硬件三方面下功夫。技术层面,有声网这样的公司解决。用户已经通过微信视频等线上实时互动技术教育,让用户接受新应用的成本降低。企业只需要寻找有机会的场景,利用实时技术,为用户、为自己创造价值。
以下是演讲全文:
赵斌(声网CEO):我今天来分享的话题,其实不是特别技术,因为今天是企业方面的讨论,我分享的是跟我们自己的经历和经验有关,从我们这里出发,我们看到的机会,我希望通过我的分享能给大家带来一些启发,也是我们对行业的一些观察,我认为还是很有深度的。
我们所做的方向其实正好也是这个方向,我们是音视频方面的实时互联网,实时互联网是什么?基本上这和我们现在熟悉的这些常规互联网的使用模式,比如说发个消息,打开个网页,甚至去看一个网站上的电影、视频不太一样。
那些东西有什么特点?就是内容和信息的产生和消费不是同时发生的?比如说你的网站也好,还是电影也好,都是很早之前已经制作好的放在互联网上,当你需要消费的时候,或者是需要了解的时候你就打开来用,这个在今天已经非常成熟了,大家在用网络的时候很少碰到用得不舒服的时候,但是如果你要在上面做这种内容或者是信息音视频产生和消费在同时发生。
比如说典型的,我们在这儿讲,有一个直播在网上传播,有很多人在自己的家里或者是办公室通过手机或者是其他的直播平台看,并且看还要求不能延迟太大,比如说有一些互动直播,需要任何时候观众有反馈,主讲的人能够收到并且有回应,这种时候就是实时的应用,最经典的反而是以前就知道的比如说音视频的通话,这里是一个技术的采用曲线,比较经典的,其实是10多以前就有了,而且曾经在互联网泡沫的第一代时间里面,曾经非常热过,当时在硅谷有一堆各种各样的实时音频或者是实时音视频的创业公司,但是确实,从现在来看,在当时的互联网的基础设施和环境条件下面,它的成熟度是不够的,所以用户体验是无法保证的,这也是为什么后来在很这块有很长的时间并没有什么大的突破,那个时代唯一留下来,让大家有印象的就是音视频通化工具,但是它的穿透率和影响力也只是局部性的,可能有一批做跨国通话的用户用得稍微多一点。
但是我在这个曲线上跟大家分享的是说,今天尤其是随着智能机的普及、4G网络的普及,这方面的技术正在快速的成长,并且在成熟的过程中,目前已经进入了一个阶段在爆发式的变化,其实用我们在这个领域这两年多以来的摸索去总结的话,我们认为这方面的技术进入了一个颠覆行业和线上生活以及经营模式的关键节点。最直接的例子就是我刚才提到的互动直播,从去年的映客等等直播软件进入每个消费者视线,让每个人都有所了解的有交互能力的,观众不是光看,一边看还需要跟主播反馈,并且主播能够根据反馈做出对应的响应这种在目前的情况下,绝大多数平台还在3秒、5秒的延迟,这种交互是有限的交互,准实时,但是这个已经跟过去的所谓的直播,实际有30秒的延迟完全不一样,这次这种移动互联网上的互动直播其实是严重的依赖互动性和递延迟的,因为你没有互动性,你就没有粉丝和主播之间的关系建立,也没有黏性,也不会有礼物或者是什么方式来创造营收的机会。
这些手机上的直播有个比较早的影子,其实有两年了,旧金山在硅谷有一段时间,在投资人和互联网的达人里面非常知名的应用叫做MarrCat,它是很早一个直播的创新的手机应用,但是他们其实后来在成长里面碰到了很多问题,我这里分享的是同一个团队,在直播没有做好的以后,做了一个新的产品叫做House Party,其实是一个视频的类似直播的多人的互动的应用,只不过有什么变化,变化就是更像视频通话或者是视频会议,实时性更强了,参与者之间可以体验上这种互动是全视频的,而不是像我们今天熟悉的,像映客这种主播式视频,观众都是发个文字、视频、表情或者是送个礼物,在新应用里面,主播或者是观众其实这个身份已经模糊了,每个人都送视频,每个人都通过视频进行相对平等交流,我想这是直播方面的创新。
为什么我们说实时互联网的应用已经到了一个节点,进入颠覆人的线上生活以及先经营模式的阶段?其实整个互动直播的行业的大热,一年多来的发展,本身就是这样一个观察的依据,我们认为像现在这种形式的实时互动直播,仍然只是实时互联网对行业和人的生活方式产生巨大影响的开端,未来类似这样的大机会,在座的不管是做企业服务,还是做消费者服务,如果想寻求改变的机会或者是差异化的机会或者是突破的机会,我觉得不妨去看看实时互动能力,实时音视频能力能不能在你的领域创造一些突破的机会,我们认为互动直播已经成为现实的第一个。
从这些应用的发展来看,还会有更多,比如说另外在做社交类的应用圈子里面,了解得比较多的是马克,他做的是什么样的模式?实际上是所谓的视频的对讲,他仍然是一个准实时的,每个人在这样的群组里面,其实这个行业回头观察的话很有意思,整个微信的发端和成长,其实有一个很早期的一些应用的影子,比如说有个叫做Kinkmasger,最早发明引起了消费者很大认同的就是一个发语音留言,而不是打字聊天的功能。马克的应用不是发语言留言,是发视频留言,在小圈子里面交流,大家发现这种互动和交流的性其实是效率更高、更直观,信息量更大。它未来的成长会是什么样,大家有兴趣可以看一下,无论是在成长还是在投资选引起的冲击都是比较大的。
再比如说这是我们跟联想所做的一个合作,联想的眼镜其实跟谷歌眼镜很不一样,它其实在寻找一些非常扎实的接地气的使用场景和模式,不是为了戴在头上很酷,而是说这种设备和功能能不能创造性的改变一些行业企业或者是生活生产的使用方式,其中一种领域使用场景就是所谓的现场处理,比如说如果你是某一家化工厂的安全的检查员,你每天的任务只需要把整个场区里面的一些关键设备运行状态,从表现到一些检测的工作都走一遍,有可能你在检查到某个设备的时候发现有点不太正常,有一些表现也许是一个变形,也许是一个什么样的东西,但是你也不能确定,有可能需要找在这个领域更有专业经验的来一起帮你判断是怎么一回事,你在现场所看到的东西就可以通过你戴的眼镜直接传到后台,可能在办公室或者是另外一个现场正在处理问题的专家那里,他就可以跟你一起,不光看到你看到的东西,也能一起分解判断这个问题的实践情况。这个就是很流行的,在美国碰到很多类似使用场景的叫See what I See”要把我自己现在所看到的情形和事情分享出去,这种分享是后面非常强大,非常有价值的,能提高很多场景下的处理效率和质量。
再比如说医疗行业,也是我们的一个客户,在美国的最大的心理咨询类的远程医疗的应用,这种使用场景很容易理解,因为美国远程医疗的发展还是非常快的,最近几年来,已经有超过一半的州,通过了医疗保险可以给远程医疗、线上医疗赔付线上问诊咨询和费用这样法律,在这个大背景下,有各种各样的远程医疗的应用发展起来,心理咨询其实是非常典型的,因为心理咨询很少依赖什么器械或者是物理的检查,其实基本上完整的治疗过程都可以在线上通过音视频通话完成,当然这个通话至少要大家听得清楚看得见,不能说一开始看得见,后面就看不清楚了,这些是最基础的需要,但是也还有一些其他的门槛,比如说一旦涉及到医疗,尤其是在美国,病人的隐私,整个系统的安全性、保密等等这些东西就变成了要求,但是这种使用场景我们看到了是膨胀发展,高速成长。
这又是一个场景,我想很多人也都用过,像去哪儿,它的服务是一个线上线下结合的,这个时候你碰到的问题是要找客服的,我们就碰到过一个用户,他说我买了一个卢浮宫的们门票,在网站上买的。但是我到了卢浮宫以后发现,他告诉我要到现场门那儿领,到了现场我发现卢浮宫有好几个门,而且楼很大,建筑很大,几个门的距离很远,我现在要搞清楚到底要到哪个门去取,可是我如果要搞清楚我要打电话回中国的客服问他们,我是中国移动用户,从法国打国际长途回中国问,而且客户你搞不清楚的话,很有可能他会让你在那等,把你候在那,听音乐。他就觉得很麻烦,或者说很难办。现在在这个上面,其实有一个网络通话的功能,在这种情况下,我想现在无论出国还是在哪里,都有一些能上网的数据服务。只要有这个服务,这个通话其实是免费的。
当然还是刚才那个老话题,如果讲着讲着听不清了,那通话可能完全不起作用。还是要有一个质量的保证。
再比如说,这也是常见的一种新的硬件,我觉得有可能大家也听说过,或者接触过,或者在家庭里,或者在企业、会议室或者办公室里,其实大家需要有这种一键即通的视频、通话或者讨论问题辅助的工具,这也是我们合作伙伴,图片里展现的是家庭的场景,可以让你哪怕离家千里,仍然可以一件看到家人做什么?可以跟他们交流。
这又回到之直播,但是它并不是像现在映客常见的社交直播,是在电商里的使用场景,其实很多做企业的人可能也知道,尤其在做销售类工作的人,可能会比较清楚,会销是一种非常典型、常见的模式。会销以前像我们这样的场所,能够讲师讲得很好,影响到台下的听众。
那么现在你是不是有机会线下做这个事?线上做这个事的效率和效果,怎么能做好?这些其实都是我所说的,实时互联网给移动时代带来的最新机会
这是一个研究报告,我们公司因为在美国和中国以及欧洲都有团队做这个业务,所以可以分享一些其他区域市场分析师的数据。2017年实时视频(实时互动视频模式),在美国的渗透率100%,每个人都会用得到。75%的美国用户,我觉得在中国可能还更高。两年之内在美国看到实时视频使用增量,至少是翻番的,在中国更高,接近50%的美国人,其实有通过实时视频跟品牌商,或者有品牌的企业服务,或者消费者服务的厂商互动。其实这些我觉得是一个象征,在这块实时视频、音视频,或者实时互联网,能够给业务、行业带来的机遇或者改变,其实正在发生中。
其实刚才讲到,这些机会。但是为了做到这些机会,中间的难度和门槛很高,这也是为什么在第一次实时音视频交流,这个概念产生之后,很长一段时间,并没有蓬勃的发展。主要互联网本身,其实没有质量保证。比如给你发一个消息,他确实有可能丢掉了。只不过我们现在所用的微信也好,或者其他应用也好,会帮你重新传一下。对于消息来说,重传收到了就可以了,就不存在问题。但是对实时的东西不行,比如我这句话说完了,我下一句话又接着讲,如果你重传,可能结果是,前一句话我还没听见,下一句话正在听,结果前一句话又到了,那话叠在一起,就无法交流和理解了。
为了解决这个问题,我们在全球范围部署一个虚拟网解决这个问题。声网做得是什么?我们所做得,就是通过刚才这个虚拟网上,建设基础设施和服务,把实时的音频、视频以及互动直播,打包成最简单的API,提供给开发者。我们最基本的使用模式,四行代码可以完成视频通话。
声网创建到现在不到三年,我们在几年的时间里,已经积累了几万开发者,通过实时的音视频服务,连接了3亿以上的终端,我们实际的使用量,每天在几百个国家都有实时音视频传输的服务使用。
我觉得这是我能够从一个做音视频实施传输和技术20年一个老的技术直男的角度能跟大家分享的。场景其实现在已经具备了,因为每一个人现在兜里都揣着一个所谓的智能手机,这个智能手机上有两个高质量摄像头,有一个高质量的麦克风,实际上是一个高质量的麦克风阵列。然后它本身是一个通讯设备,连接着4G或者更好的wifi这样的无限宽带,场景已经准备好了,用户其实已经被教育了,无论同微信的视频通话,还是现在这种互动直播,技术有我们这样的厂商和供应商在,其实也已经准备好了,那么等待大家的,我相信就是下一个创业和业务突破的发展机会,我的分享到这,谢谢。