GAITC 2021智媒专题论坛丨黄瑾:AI在媒体领域持续创新 释放数字生产力

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

11月27日,在2022全球人工智能技术大会上,由CAAI智能 传媒 专委会、中国传媒大学 媒体 融合与传播国家重点实验室、新浪AI媒体研究院联合支持的“融合与发展”新智者·智能媒体专题论坛在线上举行。华为云副总裁黄瑾在本次专题论坛上,与来自业界、学术界的嘉宾们分享了《华为云持续创新,释放数字生产力》的主题演讲。黄瑾认为,当前行业正在从移动 互联网 进入虚实融合的3D互联网的时代,媒体产业将迎来蓬勃的发展机会。

GAITC 2021智媒专题论坛丨黄瑾:AI在媒体领域持续创新 释放数字生产力

图注:华为云副总裁黄瑾-“融合与发展”新智者·智能媒体专题论坛

以下为黄瑾演讲实录,内容经编辑略有删减:

黄瑾:尊敬的各位领导,各位朋友,大家好,非常荣幸有机会参加本次会议。我在华为云负责战略与产业发展工作,今天的主题是《华为云持续创新,释放数字生产力》。今天我将分享两个方面的内容,首先来看一看人工智能领域的创新与实践。人工智能已经应用到了华为自身业务的所有主业务流程中,目前已经有超过900多个场景的应用,如销售、研发、制造、供应链等等,创造了相当于增加了12,000名数字员工。

举个例子,在供应链领域,华为的业务遍布了全球170多个国家,有190个中心仓引入了AI之后,实现了货量预估的准确率提升70%,订单履行周期下降76%,在很多的业务环节都可以使用AI来提升效率。比如智能装箱、OCR单据识别等等。在运输的环节,通过路径智能优化,就可以降低车辆租赁成本约35%。在装箱的环节,华为有8000多种各种各样的包装箱,有30多种车型,引入了AI的装箱算法之后就可以让每辆车的装载效率提升很多,每年可以节约近1亿人民币。

从华为的实践来看,我们有几点体验和心得。第一,AI已经完全具备进入所有主业务流程的能力。第二,选择价值场景非常重要,一定要沿着业务流程来识别业务对象和价值场景,尤其是要关注海量重复复杂的场景,效果是最好的。第三,业务部门的深度参与,甚至是业务部门牵头是项目成功的关键。

同时,要成功的应用好人工智能,需要实现场景、算法、数据、算力四位一体。

在华为云应用AI来服务外部的客户,我们也进行了大量的实践和积极的探索,感谢所有的客户和伙伴的支撑。那么主流的应用场景已经涵盖了,医疗、气象、智慧工业、互联网、智能媒体、城市治理、科研探索等等,已经超过了800多个项目的实践。其中30%的项目已经进入了客户的业务核心系统,凡是能够用AI进入业务核心系统的客户,平均盈利能力提升约18%。

下面我们将重点介绍几个案例,在医药行业,华为云研发了盘古药物分子大模型,大家知道新药的研发工作风险非常大,周期长、成本高,医药界存在一条“双十定律”,即一款新药从研发到上市,平均成本超过10亿美金,研发周期大于10年。即使如此,大约也只有10%的新药能被批准进入临床期。那么在抗生素研发领域,甚至有的药物刚进入临床阶段,细菌就已经产生了对其的耐受性。我们和西安交大合作,西安交大一附院刘冰教授,他带领团队在抗生素领域采用了华为云的AI盘古药物分子大模型,来做AI辅助药物设计,突破性的研发出超级抗菌药,突破了业界这个双十定律,将先导药的研发周期从数年缩短到了一个月,研发成本降低70%。

在知识计算这个领域也是一个新的创新领域。知识计算就是用AI的技术来实现,机器将知识转化成可计算的模型。在石油勘探领域,华为AI的知识计算显著地降低了从业门槛,传承了专家的知识经验,提升了油气识别的效率。油田勘探是一个复杂的过程,高度的依赖人员的经验。

例如,对数千米以下的地下构造和油藏特点进行准确判断是非常困难的,需要对大量的信息进行综合的计算,需要经验非常丰富的专家来做准确的分析。那么华为云将测井领域的知识图谱中实体关系属性表达成向量的形式,并构建深度的神经网络。油气层识别效率比传统的方法提升了5%,同时节约了专家约70%的时间,并提供智能推荐的能力,为决策层提供了更好的依据。大港油田将知识计算应用到超过900口的油井,实现了油气水层位的智能识别,平均时间缩短了70%,识别准确率达到了解释专家的水平。

我们看看焦化领域,焦化企业80%左右的成本在配煤。焦炭的质量与输入的各种因素关系非常复杂,当前配煤比例主要是依赖技术工程师的人的经验,很难做到精准。那么,在配煤主业务场景,AI就可以给客户带来更大的价值。例如鞍钢通过机理模型和AI模型的融合,构建高精度焦炭质量预测模型,预测焦炭的质量,优化配比耗时缩短至10秒以内,焦炭的质量预测准确率在98%,平均煤的成本可以降低5-20元每吨。如果年产量超过200万吨的焦煤,就可以节约成本上千万人民币。

煤矿行业,通过AI的大模型,能够围绕着安全生产、工业优化、决策指挥、经营管理等场景进行全方面的优化,可以实现智能化,减少事故,大幅提升生产质量和效率。例如,在山西沙曲矿离线验证精煤的产量预计提升0.2%。山东能源济二煤矿启动验证,按每吨精煤700元测算,预计落地收益达到1.96亿人民币。还有煤矿的现场管理是非常重要的,煤矿现场同样能通过AI来优化。

在智能 汽车 领域,通过应用华为云的知识计算,一汽红旗的4s店,一次性修复率提升了4%,客户维修等待时间下降了23%,厂家支持介入率下降了30%,维修技师的培养时间缩短了30%,客户反馈从过去的人找知识变成现在的知识找人,可以帮助员工快速的成长,成为领域的专家,推动了集团的知识化转型。

我们再看看城市治理,目前很多的城市都整合了热线系统,统一到12345,那么,华云的AI应用到了上海、广州、长沙、贵阳、湛江等很多城市的热线整合过程中。以上海的12345热线为例,这条热线的响应速度现在非常的快,而且能回答的问题非常的多。这是因为该系统去年开始就引入了人工智能的技术,用到了自动派单,语音识别,甚至有情绪感知等功能。有了这些技术的加持,整个热线的服务速度加快了,过去一张单要好几分钟的时间,现在几秒钟就搞定了,同时这些单的分发更加智能,客户的满意度得到提升。

除了效率提升和满意度提升之外,这条热线变得越来越智能,甚至可以主动的预测风险事项。例如:寒潮来了,哪些地方的水管爆裂,会提提前做出预测,让城市部门做好更好的预案,快速处理。得益于AI的加持,不仅是热线的服务效率提升了,也让市民感受到了城市管理的温度。除了生产效率改进之外,我们认为 AI也可以让世界变得更加美好。

接下来,我给大家分享智能媒体创新的实践。过去10年移动互联网的时代,整个视频用户增加超过了10亿,已经非常接近于我国的人口总数。当前行业正在从移动互联网进入虚实融合的3D互联网的时代,媒体产业带来蓬勃的发展机会。

2025年全球 VR 设备出货量将超过1亿台,AR的设备预计会达到5,000万台,应用于B端的数字人预计超过300万,C端以10亿来计。未来几年,我们可以看到3D的内容和应用会带来万亿美金的市场,但是在这个大市场的背后,仍然有非常多的制约性的技术问题,这些问题需要我们一起去探索去解决。

第一个问题,视频是内容为王的。但是目前面临的最大问题是精品的内容还是比较少,制作周期非常的长,产能低,整个中国传统的长视频产量年可以达到5万个小时。反过来我们看到优质的VR视频内容,每年产能还不到100个小时。在 游戏 领域热门的VR游戏《节奏光剑》在全球售出仅有500万份,但大家都熟悉的2D游戏《王者荣耀》日活就过亿了,在华为应用市场下载就超过39亿次,那么这是几个量级的差别,为什么会有这样的差别?

除了终端的普及率和体验之外,核心问题是整个3D音视频制作的效率太低了。好的内容生产周期要18个月,甚至是24个月,这就导致内容的供给非常的弱,制约了整个产业的发展。

第二个问题就是我们有内容制作,有直播,但当前最大的问题是网络技术,还有一些结构性的问题需要去创新、去解决。

大家现在看一个短视频,一般是720p、1080p一般最多需要5兆bps,但是我们看VR至少需要30兆的带宽,而精品的VR甚至到到百兆。所以,我们谈元宇宙,我们判断以后最少需要300兆,甚至要到一个G的带宽。从时延的角度来看看,一个普通视频时延可能不是问题,但是VR如果时延大于50毫秒,就会有很强的眩晕感。那么我们看到这个带宽需要百倍千倍的提升,时延50倍以上的提升来降低时延。所以,单靠5G光的技术是解决不了的,这个时候需要网络架构上的创新,云、网、边端的协同来解决这些问题。

华为云如何来不断的创新来释放媒体产业,更多的是数字生产力。今天我们重点探讨两个方面的内容。一个方面就是华为云能够提供四条场景化的管线,影视综艺后期管线、云上智能直播管线、虚实融合内容管线、云上虚拟互动管线来帮助大家做媒体内容生产的时候更加高效。

第二就是我们讲讲有六个方面的技术创新,使我们有更好的体验。

首先我们看看影视综艺后期管线,这个管线从DIT开始到制作成片结束,通过云上的制片系统、制作系统、云桌面、云渲染以及相关的计算存储的能力,使能整个制作团队从解决大素材上云开始,通过云上编码实现素材的套剪,通过华为影视工作站级的云桌面,解决艺术家随时随地的可以创作与剪辑,素材安全的保存,云上协同的审片,快速的渲染等等。那么,AI的应用可以大幅提升艺术家的工作效率,包括老旧素材的修复、上色、搜索、字幕生成、多轨合板,不良艺人与竞品的擦除等等,让我们的艺术家从繁琐的重复劳动中释放出来,更加聚焦于艺术的创意。

第二个是云上的智能直播管线,针对直播的需求,如高码率、高色域、融媒体、播控、5G直播等等,以及一些智能互动的直播场景。采用多地互动,AI导播切换,AI画面优化,虚拟场景等等。华为云上构建了智能直播管线,轻量化的处理,采用5G技术加云上IP压缩流,代替传统的SDI线路,降低了传统直播的转播车依赖,极大的提升了媒体从业人员的单兵作战能力,引入更多的IP化终端,如 手机 、无人机、VR自由视角矩阵等等,提升了直播设备的丰富性与多视角。专业的云上导播配合各种云端生产的开发 kit,如AI切换、虚拟场景制作、3D特效包装等等,给传统导播能力升级换代。通过RTC的技术将直播引入双向转动能力,极大的延伸了直播业务形态和打破地域的限制。

第三虚拟融合的内容管线。在虚实融合的时代,数字内容的制作方式,从摄像机实拍转向3D内容的建模、仿真、渲染,主要制作的内容就是数字人、数字物、数字场景。

精品的数字内容生产实际上面临了非常多的挑战,例如《阿凡达》当年从制作到成片花了5年的时间,有48家公司,超过1800多个特效人员,使用了超过4万多盒的CPU用于内容制作和特效渲染,很明显这个行业需要更加便捷的工具。

华为云的云上数字内容生产线,拥有百万盒的渲染资源,将影视制作的拍摄、剪辑、建模、绑定、驱动、渲染、合成到分发的全流程,在云上进行了重构,实现了流程自动化。全球的影视创作者可以无缝协作,高效协同,大幅提升制作效率,让大片内容制作周期从数年可以缩短到几个月。

第四是云上的虚拟互动管线。传统的会议、培训、展会、会谈在未来会有很大的变化。例如沉浸式的体验,更加的实时互动模式。

实际上我们看到周边的工作和生活已经有越来越多这样的例子,例如云上虚拟会议,可以提供包括会议、培训、峰会、宣讲,让参会人员以数字人的方式进入虚拟场景,全新的体验。例如云上展厅现在越来越流行,可以将实际的物理展厅搬到云上,随时随地可以参观,可以提供更加互动的参展方式,远程的接待海外的客户对我们来说非常有用。在疫情期间,我们华为利用这个能力,实际上接待了非常多的海外客户。

接下来,我们重点看看技术点上的创新,第一个是云网边端的协同。在未来的虚拟融合的世界需要通过分布式的云,通过全球一张网连接无数虚拟数字空间,在数字空间中有 社交 、工作、娱乐,同时通过弹性的调度,将海量的用户分配到全球不同的数字空间中,实现消息交互框架能够支持上亿次每秒的交互,交互时延低于20-50毫秒,这就是云网边端协同的价值,可以达到虚拟人、虚拟空间,真实人、真实空间,进行实时的交互和互动,最终实现万人同服的数字体验。

第二是数字人大脑。让数字人真正的智能化,AI是核心。我们称之为数字人大脑。通过AI的逐步应用,让数字人越来越聪明。首先是表情和肢体的控制能力,其次是记忆和学习能力。通过AI的大模型让数字人驱动,由专业动捕面捕驱动,眼睛到无中之人的自我驱动。同时通过云上的记忆和存储,通过大模型知识训练,让数字人学习到不同的知识和技能,甚至培养独特的个性魅力。

第三是 区块链 的能力,为了快速跨越产业裂谷,我们需要从传统的线下生产模式走向集约化协作共享的生产方式。我们联合合作伙伴打造了面向媒体产业的数字资产联盟链,让原来每个工作室的数字资产在云上可以安全的分享和流转,从而激发整个行业的创造力。

第四是云上的渲染,万核渲一图以及AI加持的渲染。我们知道《阿丽塔:战斗天使》的特效非常好,阿丽塔的一只眼睛比《魔戒》中咕噜全身的像素都高,这背后《阿丽塔》平均每一帧需要100个小时来渲染,总计用了超过4亿个小时的渲染时间,是《阿凡达》的三倍。

所以,渲染是创造高品质数字内容的基础。华为云借助云上的海量算力、高效存储、快捷网络和弹性调度,可以实现万核渲一图,例如《流浪地球》用5,000万美金的费用拍出了媲美好莱坞几个亿的大片的效果,其中就有华为云和我们伙伴的贡献。

那么,我们也推出了MetaEngine,这是华为自研的图形引擎。通过将云AI和计算机图形学相结合,可以大幅的提升渲染的效率。以一部90分钟的3D电影为例,原来在线下渲染大约需要6个月,使用我们部在乌兰察布的这个云渲染服务,可以降低到两周完成,如果进一步使用了我们的MetaEngine只需要7天。

第五个是多模态标签。基于AI的盘古多模态大模型,可以从视频、人像、语音、文字等多个模态自动输出对应的标签。也就是我们放一段视频之后,我们就可以自动的形成非常多的标签,然后开始来做场景的编目,智能的检索、归档和推荐。传统的方法可能需要3-6个月的时间才能完成一套自定义的标签体系。

由于盘古多模态大模型已经学习了100亿对的数据,支持万级别的数据标签,所以很容易快速自动的形成客户需要的标签体系。这个服务已经开始友好客户的试用,例如亿幕 科技 、银河威尔、贵州多彩新媒,GITV等等。其中天合智造通过AI多模态智能标签识别,实现了对视频智能剪辑,包括智能生成封面、视频拆条、人脸替换、目标擦除、智能剪裁等等。

第六是自由视角。大家看这个图的左边的子弹时间是用户可以在终端上切换第一视角,而右边的时空凝结是我们一般导演可以控制视角,给大家展示更好的全景视角。

自由视角已经在湖南台、央视等多个项目中参与了节目的创新与制作,华为云进一步将自由视角引入到直播中,我们可以允许客户获得更多更好的直播体验,提升客户的观感。

最后,回顾一下,今天我们主要是探讨了两个方面的内容。第一是华为云的AI在各行业创新的实践,第二就是我们在媒体领域的创新与实践。华为云将在人工智能和媒体领域持续的创新,不断的来释放我们产业的数字生产力。华为的公司的愿景是把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。

我的汇报就到这里,谢谢大家。

随意打赏

提交建议
微信扫一扫,分享给好友吧。