人工智能电信网络的发展趋势与应用挑战
【编者按】现网面临的网络设备和流量强度迅速增长、运维复杂性增加、技术多元性和鲁棒性需求提高等挑战是不争的事实,人工智能将是下一代电信网络的重要使能技术。目前,学术界和工业界相继对人工智能在电信网络更深入的应用方案进行研究,推动人工智能与电信网络技术的深度结合。本文从电信网络智能化的角度,梳理了人工智能在电信网中的发展现状和标准化进展,分析了其主要应用场景。通过总结人工智能电信网的关键挑战,建议电信运营商和服务商等从商业运营、生态架构、技术发展和安全保护4个层面开展电信网络的智能化演进。
本文转自“中国信息通信研究院”,作者程强/刘姿杉,经亿欧编辑,仅供业内人士参考。
引言
近年来,电信运营商在提升 网络智能化建设 方面持续投入,积极探索和实践包括大数据等在内的高效、智能的分析手段和技术。人工智能在越来越多的复杂场景下可以做出比人类更优的决策,无疑给网络智能化建设开拓了新的视野,给网络的发展带来了前所未有的新机遇,也为电信网络重构转型过程中遇到的众多困难和挑战提供了高效的加速路径。在我国,电信运营商和服务商也在积极探索人工智能在电信网络的智能化、故障预测、网络优化、智能客服等领域的应用。
人工智能电信网络标准化进展
目前, 学术界和工业界 正在积极推进人工智能在电信网络的应用和发展。其中标准化组织包括 3GPP 、ITU、ETSI和CCSA均已启动对于网络智能化和机器学习应用相关的研究,推动相关标准化进展。国内产业联盟于2018年发布《电信网络人工智能应用白皮书》,展示人工智能在电信网络应用的研究现状,发掘人工智能在电信网络的应用场景,对处于萌芽期的电信网络人工智能应用领域进行梳理。在国内,各大组织机构、电信运营商、信息服务商和产业界联盟也在积极开展标准化工作。
(1)ETSI
中国电信联合华为、中国信息通信研究院、卢森堡大学、三星、赛灵思等机构在ETSI于2017年2月成立全球第 1 个网络人工智能标准工作组——体验网络智能(ENI),致力于利用人工智能技术优化网络部署和运营。该工作组的研究范围包括分析网络人工智能场景和需求,构建策略驱动的闭环网络人工智能体系架构,成员包括亚、美、欧地区超过 40 家重量级的运营商、厂商及科研机构。目前, ENI 已完成了第 1 阶段(用例和需求的识别)的工作,并正在进行第 2 阶段(架构设计)的工作。2018年4月,ETSI对外正式发布了网络人工智能需求标准,该标准定义了网络人工智能应用的3大类14小类需求,覆盖业务、网络、功能、运维、法律等多个领域。
(2)ITU-T
2017年11月,SG13全会上成立了“Focus Group on Machine Learning for Future Networks including 5G (FG-ML5G) 面向未来网络及5G的机器学习焦点组”,目标是分析如何在未来网络特别是5G网络中应用机器学习提升网络性能和用户体验。FG-ML5G第一次会议于2018年1月29日—2月3日在瑞士日内瓦成功闭幕,本次会议就焦点组组织架构、工作组设置、相关工作内容等达成了一致,并设置“使用案例、服务及需求”、“数据格式及机器学习技术”以及“机器学习相关网络架构”3个工作小组,分别从案例、数据、技术、网络架构等维度探讨机器学习应用于未来网络中的标准化问题。FG-ML5G于2019年3月发布第二阶段计划。
(3)3GPP
在5G的第一版标准R15中,3GPP考虑把基于机器学习的网络数据分析功能(NWOAF)作为网络切片选择功能(NSSF)以及策略控制功能(PCF)的基础。在2018年6月的RAN #80全会上3GPP通过了“RAN-centric Data Collection and Utilization SI”立项建议,致力于研究面向网络自动化与智能化的无线大数据采集与应用。
(4)CCSA
CCSA在5G、人工智能等标准化领域开展了卓有成效的工作:2017年7月在TC1-WG1 #58会上讨论通过了“人工智能在电信网络演进中的应用研究”课题立项建议;2017年12月在TC5-WG6 #47会上启动了“人工智能和大数据在无线通信网络中的应用研究”的课题。研究内容包括未来无线通信产业趋势和相应的人工智能和大数据技术发展、基于人工智能和大数据的无线信道建模方法 、人工智能和大数据在无线信号检测和估计中的应用、人工智能和大数据在无线网络架构和资源管理中的应用、人工智能和大数据在无线网络规划优化和运维中的应用、人工智能和大数据在数据业务推送中的应用、基于人工智能和大数据的无线通信标准化工作需求分析。CCSA在2017年12月的TC5-WG12 #2会上讨论通过了“智能化5G核心网络切片技术研究”的课题立项,主要研究方向为智能化5G核心网切片;在2017年12月的TC6-WG1 #67次会上讨论通过了“人工智能在传送网领域的应用研究”课题立项,主要研究人工智能在光传送网络中的应用。在2018年4月,TC1召开第31次全会,WG1将人工智能作为主要研究重点,对电信行业人工智能定义与术语及应用场景与业务需求、人工智能在电信网络演进中的应用研究、人工智能标准化关键问题研究进行了讨论。
人工智能电信网络关键应用
未来,人工智能有潜力将电信网络重塑为“自动驾驶”的智慧网络,能够在网络的规划、设计、部署、运营、管理和恢复等各个环节,在终端、业务、接入网、传输网和核心网等各个层级得到应用。同时,在满足用户业务需求方面,人工智能技术也能够促使电信网络不断优化当前的服务效果和性能,并在垂直领域打造智能化解决方案,拓展应用智能化,例如智能监控、智慧物流、智慧家庭等。根据人工智能关键技术特点,电信网络智能化应用可以分为 智能分类 、智能预测、智能优化、网络操作自动化和智能网络管理5大类。
(1)智能分类
随着网络规模和复杂度的持续增长,尤其是物联网、网络切片等新技术和场景的加入,在路径规划和流量调度方面,未来网络需要能够满足高吞吐、低时延、随需而动的需求。 流量分类是一项重要且基础的网络功能。通过对不同的流量进行分类,可以提供执行细粒度网络管理的方法。基于人工智能,利用众多项目和场景所积累的多维历史数据,从大度流量负载、QoS/QoE(关键KPI)等角度对流量进行分类。
其中,大度流量分类常用在数据中心中,通过人工智能算法对大量虚拟机中的大度流量负载(比如CPU利用率、内存使用率、磁盘IO数量)进行分类,是实现自动化设备和资源管理、负载均衡和节能等功能的基础。应用层流量分类对TCP/UDP承载的业务类型进行特征提取和分类,是进行智能缓存、TCP优化、路径优化、智能推荐等功能的基础。KPI的分类和预测以满足用户QoS/QoE需求为目的,通过智能地对KPI值随时间和环境的变化进行预测,使KPI指标更加贴近网络实际情况,从而提升网络服务质量。
总体来说,监督学习和半监督学习,例如随机森林、决策树、K-NN、深度神经网络等算法常用来进行网络中的分类工作。分类的精确性往往与训练数据的数据量和维度有关。一般来说,可以通过无间断学习和半监督学习来进行数据的特征提取和降维。深度学习可以更好地进行特征提取并提高精确性,但深度神经网络的训练时间和复杂度也往往更高,适合离线工作。
(2)智能预测
智能预测在电信网络中是进行网络自适应配置与优化、NFV/MEC任务调度的基础。 其中,主要的应用包括用户移动性预测、QoE预测、流量预测和信道建模与预测等。对用户进行实时精准定位和移动性预测,是实现移动性管理、路由、小区管理和切换、功率控制、频谱管理、多天线技术、无线信号的自适应调整等功能智能化的基础,可以采用回归、LSMT和深度学习等算法,在规划、设计、部署、操作和管理阶段进行。通过对QoS/QoE参数的预测以及QoS/QoE与KPI之间关系的推理,对在线用户数的预测等可以实现对用户的智能管理和配置、减少网络拥塞、自适应资源调度、节能等;通过对SDN和边缘节点的处理能力和任务量的预测,可以实现对网络处理能力的自动化配置和优化,提高网络运营效率,实现智能化网络切片。
智能预测相关的应用通常采取离线预测、离线规划和在线路由更新的方式来进行。其中,神经网络通常用来进行离线预测,最小成本路径算法、蚁群优化算法、随机优化和强化学习等算法往往用来进行智能路由、资源管理和任务调度等网络优化工作。对QoS参数的预测往往是连续的,因此通常采用回归算法;对QoE参数的预测则采用K-NN、随机森林等算法。
(3)智能优化
在现有电信网络中,为了保障网络的全覆盖及网络资源的合理分配,运营商在网络优化工作中投入了大量的人力物力。在网络日趋复杂和业务多样化的趋势下,基于人工智能技术可以实现对电信网络大规模数据的训练,将推理预测结果和大量的专家经验模型化,从而实现主动式优化和网络性能的最大优化。智能优化主要的应用包括RAN辅助TCP窗口优化、网络能耗优化、网络覆盖优化和智能缓存等。
RAN辅助TCP窗口优化利用(深度)强化学习、决策树和贝叶斯网络等算法,通过实时地向应用层通知无线电接口信道和负载状态,从而在应用层调整其传输数据传输率、优化TCP窗口,来更好地在应用层与RAN之间进行匹配。
在电信网络中,接入环境复杂多变且不确定性较强,链路自适应优化应用利用深度学习等人工智能技术对网络历史信道状态数据和相应的KPI数据进行训练学习,寻找影响无线网络质量的关键因素,从而构建智能优化引擎。优化引擎能结合现网运行状态准确实时地给出优化调整建议和决策,如天线下倾角和方位角调整、性能参数优化、调制编码方法、邻区配置调整等,在保证每个用户的性能下优化网络覆盖。
由于网络的忙闲状态具有较大的时空差异性,网络能耗也有较大的优化空间。利用人工智能技术对网络覆盖、用户分布、业务特点进行综合分析,借助流量预测结果,精准预测热点小区,可以智能设置网络设备休眠和唤醒的时间,提高区域网络资源利用率,并有效降低区域网络能耗。
另外,K-均值聚类、(深度)强化学习、LSMT、DL等算法则可以被用来预测并优化不同网络状况的缓存系统,最优化服务延迟和网络负载,实现智能缓存。
(4)智能网络管理
智能网络管理包括智能路由、负载均衡和小区的融合分裂、工业4.0网络管理、无线控制、智能调度、智能信号处理和智能安全等方面。智能路由利用历史数据和细粒度网络测量数据,通过预测网络负载和容量,最大化优化路由路径,包括软件定义路由、无线网络路由、数据包路由和机器学习需要的数据路由等。负载均衡和小区管理基于对网络流量和用户数的分析预测,实现小区之间自动化的负载均衡、小区的快速融合和分类等功能。
机器学习有效地提高了工业4.0网络管理的效率,基于环境观察和制造模式,可以动态且连续地管理和优化工业物联网网络的操作行为。智能化无线控制基于网络历史数据对网络进行预测,动态且自适应地对网络设备进行功率控制和频谱管理等。智能调度基于对网络流量和用户数的分析和预测,对运算资源和网络资源进行动态调度,从而降低全网络所有用户的服务延迟和能量消耗,提高网络恢复和自愈能力。半监督学习、长短记忆(LSTM)、深度强化学习等机器学习算法可以用来将网络的测量数据、用户的位置信息和信号反馈数据等作为输入,并学习出优化的信道估计结果、波束赋形和调制解调的选择策略等。机器学习算法,例如DBN、决策树和K-NN等,还可以用来对设备信息和测量数据进行分类,对网络的软硬件进行智能安全性保护,并利用一定的恢复模板进行网络自愈操作等。
(5)网络操作自动化
网络操作自动化利用人工智能技术,实现对网络的规划设计和运维管理等过程由人工向自动化和智能化转变,主要应用包括业务—网络映射、网络设计与部署、故障检测与恢复、网络资源适配等。
业务—网络映射利用贝叶斯网络、概率图模型和逻辑推理等算法,对业务需求和逻辑网络需求数据进行学习推理,自动将网络服务用户需求转换为网络服务提供商对网络服务部署要求的功能。
人工智能技术还可以将网络运营商对网络的设计意图、规范、部署流程和设计结果以及网络性能等进行训练学习,实现自动化的设计意图和网络规范,以使网络操作员远离频繁的模板/脚本更新作业,实现运营商网络服务流程的自动化。同时,软件定义网络(SDN)和网络功能虚拟化(NFV)将依赖网络自动化来实现服务的灵活性和高效性,获得高效益。
对电信网络的故障检测、分析(故障类型和位置)以及恢复是实现网络闭环操作的基础。人工智能驱动的预测推理功能可以帮助电信运营商和服务商通过对网络健康度和关联指标的实时监控,利用训练的特征规则,分析推理网络趋势走向,基于模式预测故障,并从根源上提供更好的解决方案。人工智能将带动智能网络运营与维护的发展,实现网络自我优化与自我修复等。
人工智能电信网络的应用挑战
电信业的智能化演进不是一蹴而就的,其智能化发展尚处于起步阶段。如图1所示,人工智能在电信网络中的应用和发展过程需要解决至少在商业运营、生态架构、技术性能和安全保护4个方面的挑战。
(1)商业运营
第一,目前缺乏能帮助在电信网络引入人工智能技术的相关技术和专业人员 。单纯的人工智能公司存在技术壁垒,不能很好地理解电信运营商和服务商的需求。而从运营商内部来看,则缺乏相应的算法专家和数据科学专家等新型人才。 第二,电信网络智能化将从人工主导变为机器自治,传统模式到智能化模式的转变将颠覆传统运营模式和运营商的职责权利。 同时,电信网络的发展往往基于稳健和网络鲁棒性的考虑进行网络的发展和演进,在面对快速迭代和“黑盒”操作较多的人工智能技术时,运营商需要改变以往保守的基因,这无疑是具有较大挑战的。 第三,在运营模式上,现有电信网络大多基于标准化和封闭的网元结构,而网络的智能化使得网络的运营需求对运营商的开发运营一体化以及市场、网络和IT的协同能力提出了更高的挑战,需要构建快响应、高效率、灵活服务的运营能力。第四,在业务模式上,通过引入人工智能可以解决网络的哪些商业问题并带来新的盈利场景还需要运营商和服务商进行探索和研究。
(2)生态架构
第一,人工智能在电信网络中的应用需要传统的电信生态向跨领域、跨专业甚至跨行业的采购和服务提供的方向改变。整个电信生态圈和上下游的组织架构将发生变化。第二,电信网络的智能化需要运营商增加新的数据存储装置和运算设备来满足人工智能对数据和算力的需求。同时,人工智能用例需求增加一些现有网络所不需要传输的数据流、网络/管理实体和接口等,这将对现有的网络架构造成冲击。第三,人工智能在电信网络中的应用对网络的可靠性和可扩展性要求较高,需要大数据平台、SDN/NFV编排等技术的支持。第四,人工智能算法存在较多的黑盒操作和不可解释性,为电信网络带来了一定的监督审查困境。人工智能下的电信网络需要新的评估方式和性能指标,包括数据质量评估、机器学习功能性能评估、安全和隐私性能评估等。
(3)技术性能
首先是来自数据方面的挑战。如何对电信数据和数据集进行整合和标注,是发展人工智能电信应用的挑战。人工智能电信应用需要在网络中采集、传输和存储现网中所不需要的一些数据。如何提取优质数据,能否提取出传统网络中没有收集到的数据,以及把有用的数据从中间状态识别出来,都将是重要的挑战和难题。用户隐私和数据安全等相关的政策法规尚未健全,给人工智能应用数据的合规性和脱敏要求带来挑战。其次,如何在需要高稳定性和鲁棒性的电信网络中选择设计合适的算法,并对人工智能算法进行有效的性能评估,对鲁棒性和可解释性进行评测和保证,是发展人工智能电信应用需要解决的问题。再次,人工智能算法对网络计算能力带来挑战,电信网络传统服务器尚不具备大规模并行计算能力(GPU、FPGA、ASIC、TPU),如大量使用深度学习进行模型训练,会出现计算能力瓶颈。
(4)安全风险
人工智能给电信网络的安全和隐私保护增加了新的不确定性和风险 ,包括网络安全风险、数据和信息安全风险、算法安全风险等。首先,人工智能技术及其本身存在的漏洞可能会被恶意节点或敌手用来对网络实施攻击和破坏。其次,对于电信系统中开放性较高、安全防御较为脆弱的新型网络系统,例如物联网、无人机通信等,人工智能带来网络安全风险不仅会带来数据泄露、影响网络功能和连通性等问题,而且可能会直接导致整个系统被挟持或瘫痪。自动驾驶、无人机等系统的非正常运行,可能直接危害人类身体健康和生命安全。再次,人工智能算法在电信网络中应用时需要大量的数据进行训练和推理。在应用人工智能技术的过程中,数据的采集和训练可能增加信息安全和隐私泄露风险。因此,需要构建和完善智能电信数据的安全体系。最后,算法设计或实施有误可能会降低网络性能甚至带来伤害性结果。当数据集选取不合理或偏差较大、目标函数的选取不合理、对环境认识不充分、算法表达能力不足时,都可能会导致应用结果的效能低下。同时,对抗人工智能算法的攻击也会导致算法性能低下或错误结果。
结束语
人工智能算法提供的赋能技术,可以应用于电信网络和相关垂直业务的各个方面,并将成为 下一代电信网络 的重要使能技术。但目前电信业的智能化演进不是一蹴而就的,其智能化发展尚处于起步阶段。现阶段深度学习等人工智能算法仍以一种保守慎重的方式局限在规划、运维和智能客服等方面。人工智能在电信业中的应用需要在保证电信网络本身的鲁棒性要求以及对其他行业的基础支撑功能的前提下,考虑算法的成熟度、数据的丰富程度、场景的难易程度、系统的稳健能力等,从商业运营、生态架构、技术性能和安全保护等诸多方面进行发展演进,在端、管、云侧,由点及面,根据智能化的细化和难易程度逐步实现人工智能技术的渗透。
推荐阅读
用人工智能算法提供新思路,看智慧医疗的三大革新
人工智能的算法黑箱与数据正义|亿欧智库精选
本文已标注来源和出处,版权归原作者所有,如有侵权,请联系我们。