阿里云的“A站修复术”
AC娘,A站拟人化萌娘
A站悬崖勒马,要重新做“站”了。
近期,A站不断释放出了要复活的信号,新掌门文旻上任、5.7亿扶持UP主、独播新番上架……最重要的是,视频竟然不卡了。
回顾一年前的A站,视频卡顿、服务器宕机是一件再正常不过的事。2017年11月,A站曾因一次大规模的DDOS攻击,宕机3天,A站前负责人在回应记者采访时却使用了一套二次元话术:“我们是一个‘主角’公司,A站更像动漫里的主人公,没有哪一个主人公是一帆风顺的。”
太执着于从二次元的主观角度思考问题而在技术等问题上“躲猫猫”,直接导致了2018年2月A站因融资未到账、无法支撑运营而关停了网站。弹幕鼻祖A站面临停摆危局。
2018年6月,转机出现了,快手宣布了对A站收购的消息。
被收购后的A站有了更充足的资金用于支撑运营。而作为一家弹幕视频网站,如果没有专业的视频技术支撑,A站很难从跌倒处爬起来。因此,A站对技术的重视程度也在逐步提升。
在被收购后的一个月,A站便与阿里云一拍即合,对系统进行了技术底层大换血。经过了半年多在技术上的全面整顿,A站视频不卡了、产品需求能迭代了、视频审核更快了,这其中用到的正是市场上已经相当成熟的视频云技术。
全面迁移至阿里云
为了对阿里云的“A站修复术”一窥究竟,钛媒体对话阿里云主要负责A站项目的两位架构师张翔贺、吴国钊,以及A站技术负责人飞哥。
据张翔贺、吴国钊回忆,阿里云主要从IaaS层的数据存储以及PaaS层的应用服务对A站进行了迁移改造。
“说简单一点是平台的搬迁,但其中涉及到很多细节,并不是简单的数据copy的过程。”
从数据存储来说,除了视频数据的迁移,阿里云对A站原有的视频也进行了一次梳理,比如对视频格式、视频数量、文件命名的梳理等。
从应用层来说,前端播放器、中间视频上传、转码以及内容审核等等业务都从优酷搬到了新平台,所有业务接口、功能接口全部进行了调试、配置,相当于基于阿里云的点播服务重新做了一个平台。
“原来的一些视频原片是不是要转成新的视频码率?迁移的过程中,两边的数据是不是有视频丢失?视频传输搬迁过程中是不是有视频重复的问题?这些都是要在整个过程中慎重考虑。”张翔贺介绍。
吴国钊补充,当时阿里云派出了一整套团队来支持A站的迁移,从整体解决方案架构师,细化到CDN解决方案架构师,再到项目经理、服务保障经理,还有前端开发到中间运维保障、售后服务保障等等,涉及了大范围团队合作。
在技术整顿的半年里,A站后端视频点播等相关的云计算服务都由阿里云来支持,A站技术人员工则在阿里云平台的基础上自研了一套自主可控的视频播放系统。“策略自己可以控制,整体下来,发现A站的产品需求能迭代了,出了问题能及时处理,想临时加哪些功能,跟阿里云沟通之后能及时接入,相当于是模块化的,成本也非常低。”飞哥说道。
“关键先生”视频点播技术
如上文所述,阿里云从IaaS层的数据存储以及PaaS层的应用服务来帮助A站解决技术问题,但在这两者之中,数据存储解决的是通用性的缓存、分发等问题,而PaaS层的应用服务——视频点播技术才是A站所使用的比较关键的服务。
相对于视频直播服务而言,视频点播服务(Video on Demand,简称VOD)是指把用户所点击或选择的视频内容传输给所请求的用户。
据钛媒体了解,在云计算服务方面,点播服务本身并不复杂,复杂的地方在于这一产品与客户业务相捆绑、集成的过程。
A站所使用的点播服务就涉及到语音视频的采集、上传、编辑、转码、审核、分发等一系列的流程。
以视频转码为例,由于A站不同UP主所上传的视频码流不同,A站需要使用阿里云的点播服务将几十种个性化的视频格式在保证清晰度、流畅度、文件大小适中的情况下将这些视频转成统一的码流,再进行统一分发。这样,不仅方便用户播放,而且对视频播放器也非常友好,可以节省计算成本。
“这一服务的好处还在于,阿里云的转码技术可以分阶段告诉A站视频转码的进度,比如某一个视频某格式转换完毕,就可以先把这种格式放出来,用户可以提前看到最新视频”,飞哥告诉钛媒体。
“原来A站UP主所上传视频的转码状态都需要技术人员亲自去查,一般都要等到所有视频格式转码完毕,第二天才审核放出。”而在经过“修复术”之后,现在A站视频转码的响应速度是分钟级别的,大大提高了视频的审核效率。
另一个对A站影响比较大的功能是对视频播放地址获取。
在使用阿里云服务之前,A站视频播放地址的生成、播放文件地址管理都在优酷平台上进行,A站用户发出观看视频的指令后,视频播放系统需要先通过公网到优酷平台取一次视频数据,取完之后A站自己再做一次业务上的判断,然后用户才能看到视频。
而阿里云的标准化的点播服务可以将视频地址自动回传给A站,这样播放流程就有了更大的优化空间。“最终经过大家的努力,使得用户访问视频的首屏时间从原来的3-4秒,缩短到了不到1秒,非常流畅。”飞哥说道。
张翔贺表示,阿里云之所以能够解决A站在视频点播方面的问题,是因为以为服务百万以上互联网用户群体为背景,阿里云所收到互联网需求非常精准,在这种情况下所开发的功能和服务等多方面都采取了一种商业化的运营模式。这也是为什么A站之前使用优酷服务出现“水土不服”的原因。
他提到,为了提升产品灵活性,阿里云会先将通用性的需求做成标准化的服务满足大多数客户的需求,同时也会面向头部客户提供定制化的功能开发,通过标准化+定制化的服务支持,把原来标准化的服务进行了进一步的提升和保障,例如A站正在使用的阿里云视频内容防护服务。
提供视频内容防护、AI审核等附加服务
盗链和盗播是内容服务商经常遇到的系统安全威胁。盗链指的是,受益者把其他服务商的内容链接地址放在自己网站上;盗播是指,把网站上的视频下载起来,放在本地或者其他网站上播放,这两种方式都是为了骗取最终用户的浏览和点击率,受益者不提供资源或提供很少的资源,而真正的服务提供商却得不到任何的收益。
“2017年上半年,A站大部分流量被盗走了。”飞哥回忆。
但阿里云介入之后,A站这方面的损失减少了80%-90%。
据张翔贺介绍,防盗链、防盗播技术本身对于互联网音视频提供商来说是很一个很通用、很朴实性的需求,但不同的客户在不同的场景下,技术的实现方式有多种。“我们当时针对于A站视频内容素材、访问方式等做了整体的重温分析,制定了一套完整的视频内容防护方案。”
飞哥表示,防盗链、防盗播功能给A站带来的最直观的改变是带宽成本的降低,同时也保护了A站视频资产不被盗用。
钛媒体了解到,视频内容防护是阿里云为A站提供的围绕核心点播服务展开的附加服务,像这样的服务还有AI视频审核等。
飞哥表示,A站使用AI技术最多的地方是图像的审核上,比如利用AI对视频中的涉暴、涉黄等内容进行自动拦截,减少人工审核的压力。另外,AI也可以通过对视频中图像、语音、物体、文字等多模态分析,自动输出视频多维度内容标签,提升搜索体验效果。
之所以能够在点播服务的基础上根据A站的需求增加附加功能,是因为阿里云的视频点播服务是模块化和标准化的。对于A站来说,可以按照自己需求去选择相应服务能力,这样不仅能够满足业务快速发展的稳定性,而且也不需要投入很多运维或技术方面的人力做视频点播基础技术能力的研发,只聚焦于核心业务。
目前,飞哥所带领的A站技术团队主要工作已经不再围绕点播服务展开,而是A站后端开发、业务迭代,运营、产品、市场等方面相关技术的落地。
钛媒体了解到,A站在经过的半年左右的技术打磨之后,已经进入了平稳运营阶段,视频播放更流畅了,不宕机了,用户量快速增长,日上传视频数明显上升。
“虽然进入平稳运营阶段,但A站跟阿里云还在保持每周一次的面对面交流,一是确保客户质量达到预期,二是看看原有的服务是否需要作出变更,以及A站在不同的时间段是否有新的需求产生。”吴国钊向钛媒体表示。他透露,近期,A站与阿里云正在沟通一款新的防盗链功能,希望能够继续提升A站在视频内容防护能力。(本文首发钛媒体,作者/秦聪慧)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App