港大黄凯斌:6G时代的边缘智能,香农与图灵的相遇
作者丨黄凯斌
整理丨维克多
5G时代刚开始没多久,现在科研人员已经开始攻关6G。科研真是生产一代、研发一代。在6G场景下,新的通讯技术会给人工智能(AI)带来什么?有哪些创新的想法?
4月8日,在AI TIME青年科学家——AI 2000学者专场论坛上,香港大学电子电机工程系教授、副系主任 黄凯斌 做了《6G时代的边缘智能:香农与图灵的相遇》的报告,从无线电通讯的角度解读了6G优势,以及对AI的启示。例如他提到:
“在香农无线电通讯理论里“数据位生来平等”。而以图灵为先驱的机器学习领域里数据有“轻重”之分。其实,只有有机结合两者的思想,才能实现最高效的应用。”
此外,他还提出空中计算的想法,目的是将“空气”变成计算机,具体“手法”是让用户以相同的频谱上传信息,从而利用无线叠加计算相关权重、模型,此举是将无线干扰这一令人头疼的麻烦事“变废为宝”。
以下是演讲全文,AI科技评论做了不改变原意的整理:
6G是指第六代无线通讯网络,会比5G有更大的性能提升。如下图所示,灰色代表5G,6G无论是从速度还是空中传输时延,亦或是能源效率都会大幅度提升。
为什么会需要6G?关键是它可以支持一些“未知”的应用。例如处理超实感扩展现实、高保真移动全息显示、数字复制都需要6G网络支持下的高速率、低延迟。
在计算领域也会有一些革命性的改变,十年前,我们将大量计算放在了云端,放在了“数据中心”里面,现在计算更加侧重于网络边缘。主要因为物联网的规模越来越大,其包含的“小设备”,例如手机、笔记本电脑,已经达到了百亿的级别,因此为了服务这些小设备,计算也逐渐从“中心”转向了“边缘”。
此举一方面给用户带来快速的体验,另一方面也会更加保障数据安全。毕竟,边缘计算不需要用户上传数据到云端。
数据的重要性不言而喻,过去最值钱的公司当属石油、银行。而现在谷歌、Facebook以及特斯拉这些占据榜首的巨头,都是数据拥有“大户”。数据越多,AI所能学习的知识也越多,据福布斯估计,到2025年,大约有150万亿GB的数据需要分析。
因此,在网络边缘的语境下,AI如何处理如此巨量的数据?数据传输的过程可以简单理解为通讯。
网络通讯不仅要满足AI需求,还有机器之机器之间的通讯(mMTC),网络游戏和自动驾驶(URLLC)、高清晰流媒体(eMBB)等。因此,目前网络现状,正如上图“胖子”所示,它已经不堪重负。所以,研究如何消除计算瓶颈,才能提高边缘学习的效率。
从1G到5G,计算、感知、控制、通讯等几个模块都是分开设计,这种相互隔离的模式无法解决计算瓶颈问题;6G的设计模式是融合,将几个模块有机连接,这种连接的过程就是“香农”和“图灵”思维的碰撞。
在过去,信息和通讯是两个毫不相干的领域,以平行的道路发展,而当前的边缘学习需要这两个领域的结合。
传统的无线电通信就像一条管道,通过速率最大化的设计,让管道里有很多数据进行传输,换句话说,就是在高保真的情况下,尽可能多地传输数据。但,这种设计已经无法解决现在的问题了。6G时代,并不是数据传输的越多越好,而是越快的训练模型越好。即在对学习精度有限制的情况下,尽可能快地训练机器。
因此,如果考虑“快速智能获取”,无线电设计发生革命性的改变。传统方式是联邦边缘学习,网联汽车、物联网等密集终端场景下,训练数据通常以分布式的形式产生和存储在不同用户设备中。例如我们每天淘宝、京东的购物数据都存在自己的手机上,如何在保证自己数据隐私的情况下,帮助训练网络更高效?
在网络边缘利用联邦学习,可以充分利用终端节点的计算资源,并能够在保护用户个人信息的前提下,进行更广泛和高效的机器学习。
具体做法是:用户的每台手机利用自己的数据进行模型训练,然后中心系统将这种本地模型收集起来,然后进行平均处理,如此就可以得到比较准确的模型。
但,将每一个小模型上传到中心系统,也需要大量的数据传输,而且有些传输并不是一次就完成,有的需要几十上百次的传输。
无线电通讯如何解决这一问题?我举两个例子:空中计算和数据重要性感知通讯。
第一个例子是空中计算,目的是将“空气”变成计算机。传统的无线电通信面对的问题是“过载”。例如所有的用户都会发射信号,以求通过“管道”达到基站,但无线电在空中的叠加,会造成无线电干扰。因此,需要采取分布计算的思维进行重新设计系统。
回到联邦边缘计算。正如刚才提到,联邦系统其实是想进行“平均”计算每个用户的模型,用户需要将小模型上传到系统中才能进行此步骤。其实,我们可以利用无线电波在空中叠加的状态进行计算。其实,用户如果以同样的频谱将模型传到“空中”,速率会非常快,而且在空中会自然叠加。因此,这就有效将无线干扰变成了“好东西”。
空中计算的最大好处是会将延迟大幅度减少。如上图,和传统无线电传输技术相比,在保证准确率相似的情况下,延迟能减少上百倍。
第二个例子是数据重要性感知通讯。香农无线电通讯理论基于“Data bits were born equal”,翻译成中文“数据生来平等”。而在以图灵为代表的机器学习领域,“Data samples are certainly not equally important!”,数据有“轻重”之分。
数据重要性,可以用未知度进行衡量,举个例子:给机器人一本书,机器人看过之后表示非常简单,什么都理解,那么这就不是一本好书。换句话说,这本书的未知度很低,无法教给机器新东西,无法解答疑惑,知识无法扩展。
因此,结合两者的哲学,我们需要重新设计无线电系统。如上图所示,需要选择一些用户数据传输到基站中去。从图灵的角度,优先选择未知度高的数据,也就是最重要的数据;从香农的角度,信道是首先考虑的因素,忽略了数据的重要性。这这两种思路,一种叫数据多样性,一种叫信道多样性。
有效结合数据多样性和信道多样性是6G系统的重点。我们对此进行了相关工作,实验结果非常满意。如上图所示,如果只考虑数据重要性,所得出的效果会比信道选择更佳,但如果结合两种,那么准确率会超过“只考虑数据重要性”。所以这种思路的改变,会给我们产生很多的机会。
6G的愿景之一是用卫星往地面发射 AI的服务,即把空中几千几万个卫星,和地面的基站连接成空地网络,然后和数据中心连接在一起。从而赋能自动驾驶、远程实时通讯、应急通讯等等。
我们的西安电子科技大学合作团队,最近发射了一颗卫星。我们将一起合作用下来陆续发射的多颗卫星形成的星座实现“用卫星往地面传输AI应用”服务。
6G时代,通讯已经超越传统,不仅是针对人的通讯,还涉及到了机器对机器的通讯、机器和人的通讯。现在模拟通讯也开始重新发力,虽然不怎么可靠,但速度特别快。毕竟它不需要编码、模块等复杂的流程。
以上的内容希望能给大家带来一些想法。
雷峰网 (公众号:雷峰网) 雷峰网
雷峰网原创文章,未经授权禁止转载。详情见。