70分钟,干货十足!百度CTO王海峰在新华社带来一场人工智能课
“读书使你充实,学习成就精彩”。 3月19日,百度首席技术官王海峰博士作为新华社 “书香新华悦读汇”第五期演讲嘉宾,携《AI已来》一书,为现场70多名热心读者,以及线上2000余名观看直播的全社同事奉上了一场关于人工智能的饕餮盛宴。新华社副社长刘思扬出席悦读汇现场。
据悉,“书香新华悦读汇”从2020年11月起已举办四期,本期主题是 科技 领域备受关注的人工智能。《AI已来》一书围绕王海峰博士探索人工智能的研究经历展开,讲述了中国AI三十年的决然前进与不息生长。
王海峰表示,“新华社在我心目中是非常崇高的地方,我们党和国家的许多重大信息都由新华社发布。当下,人工智能已经成为新一轮科技革命和产业变革重要的驱动力量,希望通过这次机会,跟大家交流一下人工智能是什么样的技术,为人类带来什么样的改变,包括为 媒体 人带来的变化。”
现场,王海峰博士首先围绕人工智能发展历程,为大家讲述人工智能如何成为新一轮科技革命和产业变革的战略性技术;其次,介绍自主可控的人工智能技术,以及基于标准化、自动化和模块化的AI大生产平台,人工智能技术的大规模产业化;最后,阐述人工智能技术在媒体行业的广泛应用,助力媒体创作提升效率和质量。
王海峰对人工智能的兴趣始于童年时代喜爱看的动画片《铁臂阿童木》,并由此萌发了成为科学家的理想。他介绍了自己近30年的AI研究之路,从1993年进入哈工大机器翻译实验室起,持续探索人工智能的科学奥秘,致力于把AI技术用于提高人们的生产生活水平。人工智能已经有60多年的历史,经历技术的演变和几起几落,发展到今天已经具备了标准化、模块化、自动化的特征。王海峰认为,“随着技术的发展,随着大规模的产业应用落地,人工智能已经进入到工业大生产阶段。”
百度打造的自主可控的人工智能技术涵盖了基础层、感知层、认知层、平台层和AI安全。基础层是数据、算力和算法,是支撑新一代人工智能快速发展的核心基础;感知层包括语音、视觉、虚拟现实和增强现实技术;认知层包括研究语言与知识的自然语言处理技术,让机器像人一样,掌握知识,理解和运用语言,具备认知能力;平台层则是面向开发者和合作伙伴打造繁荣生态;安全体系则纵贯各层,为AI技术及应用保驾护航。
在基础层,AI芯片、深度学习框架等一系列自主创新的“硬核技术”备受瞩目。
百度自主研发的云端AI芯片昆仑,百度昆仑1量产已超过2万片,并实现了应用部署,预计昆仑2将在2021年上半年量产,其性能将比昆仑1再提升3倍。终端语音芯片百度鸿鹄,在智能家居、车载等领域均有大规模的应用。
飞桨深度学习平台是我国首个自主研发、开源开放、技术领先的产业级深度学习平台。深度学习平台在整个人工智能技术栈中处于承上启下的核心位置,相当于“智能时代的操作系统”。飞桨平台具有开发便捷的核心框架、支持超大规模深度学习模型训练、多端多平台部署的高性能推理引擎和覆盖多领域的产业级模型库等四大核心技术。如今飞桨已凝聚265万开发者,服务10万多家企业,创建了超过34万个模型。
AI核心技术和算法层面,感知和认知技术也在不断创新突破。语音方面,基于麦克风阵列的声音增强和声学建模一体化的端到端识别,使得语音识别的错误率大幅降低;业界首创的多分区模型波束技术则有效解决耳机等终端设备“串扰”问题。
视觉领域,技术已达到全场景覆盖,包括图像、视频、AR/ VR 等等,以及视频、文字、车辆、人体等各种垂类的识别技术,在各领域得到了应用。同时,百度还开发了视觉AI SDK,3D结构光模组等等,构建软硬一体的视觉技术能力。
在自然语言处理方面,百度构建了世界上最大规模的知识图谱,拥有超过50亿实体,5500亿知识,并在不断演进和更新,已应用于各行各业,日均调用次数超过400亿次。基于知识增强的持续学习语义理解平台文心(ERNIE),在深度学习的基础上融入知识,具备人类一样的持续学习能力。
“知识增强的跨模态深度语义理解”是针对复杂应用场景高精度语义理解的技术创新。语音语言一体化理解、图像语言一体化理解,使得语音识别及图像识别的准确率大幅提升。而融合语音、语言的同声传译技术,翻译准确率超过80%,时延3秒,与人类水平相当。百度同传已支持多场国际会议,为2020服贸会提供机器同传服务,总观看量接近500万次。
除了对AI技术进展的讲解,王海峰还着重介绍了AI在产业中的案例与应用。如今,人工智能已广泛应用在工业、农业、交通、医疗等领域,其在智能搜索、人工智能地图、电网智能巡检、智能交通等方面的案例帮助提升了产业的效率、降低了风险,为人们生活带来了便利。
同样,人工智能技术也为媒体行业带来了深刻的变化。
新华社作为媒体人工智能领域的领军者,近年来研发推出了“媒体大脑”、人工智能合成主播等新技术、新应用,建成了全球媒体首个“智能化编辑部”,大幅提升了新闻生产效率。
王海峰详细介绍了百度的智能媒体中台,结合领先的AI 技术和云计算能力,助力新闻生产的策划、采编、审校、发布等全流程。以涵盖存储、计算、网络等能力的媒体云为基础,媒体知识中台包括媒体知识图谱、跨模态检索和推荐,媒体 AI 中台包括 AI 能力引擎、智能创作平台和智能视频平台;在此基础上,支撑智能策划、智能采编、智能审校、AI 主播等媒体行业应用,加速媒体行业智能化变革。
而完备的平台能力源自丰富的产业实践,近年来,百度已经与新华社、人民日报、央视网等20多家权威媒体机构达成合作,百度人工智能技术正在大规模应用于新闻实践中。
报告结束后,现场读者还和王海峰博士展行了热烈的提问和互动,并获得王海峰博士亲笔签名赠书。有读者问到,“AI+新闻的未来会是什么样子?”王海峰表示,目前策、采、编、审、发,全流程现在都有AI在起作用,落地已经非常迅速了。技术的进步一旦过了某一个临界点以后,就意味着它已经能明显的带来收益,提高效率,甚至很多场合比人做得还好。因此,这个应用会普及得非常快。
他举例解释,11年前刚到百度时,就开始做机器翻译相关工作。2011年6月百度翻译刚上线时,每天翻译百万字符就是非常有成就感的事了。而如今,百度翻译每天翻译超过千亿字符,扩大了10万倍。王海峰说到,“科技一旦带来改变,将是颠覆性的变化。”
人工智能作为这一轮科技革命和产业变革的战略性技术,已经成为科技创新的新动能。王海峰表示,希望在AI时代一起奔赴科技创新的星辰大海,实现我们国家的科技自立自强。