蓬勃发展的万物互联和融合智能化为ICT产业带来了新的发展机遇与挑战。IP网络承载大量跨地市、跨省甚至跨国的语音及数据业务,网络配置变更包含大量高危操作,必须慎重,否则会造成巨大的损失。例如网络中一个细小的路由配置错误可能导致很广的波及面,给运营商和用户造成巨大经济损失,中断的时间越长,运营商额外承担的成本就越高,甚至可能影响社会的正常运转。即便网络维护工程师慎之又慎,由网络配置变更导致的网络故障占比依然高达80%。TM Forum发布的报告中指出,43%的运营商认为手工配置会严重影响其业务能力。由此可见,运营商亟需一种在线配置验证工具,能事先评估验证网络配置影响并成功拦截错误网络配置。
广东电信努力完善IP网络风险控制体系,积极探索,不断实践,致力于打造自动化、智能化的IP网络运维平台。广东电信与华为公司开展深度合作,共同打造云网预知系统,结合网络数字地图提供的数字孪生网络和高精度仿真服务能力,提前感知配置对网络的影响,做到风险配置变更事前评估、错误配置不入网。云网预知系统提供的网络协议仿真能力,以网元配置数据为基础,模拟设备路由协议的行为,精准生成网元协议路由表、全局路由表,并以路由表项为基础展开分析,最终完成对网络影响分析的验证。通过云网预知系统对网络进行在线仿真和配置验证,极大提升了网络运维中业务配置的效率,减少了影响网络的风险。
基于数字孪生网络的高精度仿真框架
IP网络的原生特征使得IP网络复杂且重要,其主要特征表现在如下3个方面。
一是规模庞大,管理复杂。IP网络的管理难度随设备数量和连接数量的增加呈现指数级增长,对运维人员技能要求高。
二是单点错误,全网扩散。IP网络采用分布式路由协议,单一错误会迅速扩散至全网,造成全网级网络事故。
三是配置错误,业务瘫痪。作为最底层基础设施,IP网络发生故障会触发核心网等业务瘫痪。
近年来,全球发生了多起IP网络引发的重大事故。IP网络传统业务配置依赖人工操作,事前难以预知配置下发后对网络的影响,重大IP网络故障70%以上是由人为配置错误引发的。
IP网络传统配置变更流程无法预知配置变更对网络的影响,配置错误不仅会导致业务中断,还会造成潜在的风险。比如IP网络存在各种路由策略,路由策略会影响IP网络路由选路规则,一个错误配置可能会影响上百万条路由;IP网络存在各种链路参数,比如IGP COST、TE Metric等,一个错误配置就可能导致“黑洞路由”;IP网络存在各种QoS配置,QoS配置会影响流量通过的大小,一个错误配置就可能导致流量大规模突降。综上所述,IP网络的配置错误会影响整个网络的业务流量流向,导致业务受损,要做到配置100%的准确性,依靠专家评审是不可行的,必需要有技术手段事前感知配置对网络的影响。
数字孪生网络(D i g i t a l Tw i n Network)是以数字方式构建物理网络实体的虚拟孪生体,且可与物理网络进行实时交互映射。网络的数字孪生体作为物理网络设施的数字镜像,与物理网络具有几乎相同的网络拓扑、业务及流量数据模型,是真实物理网络全生命周期、多维度的精细化“副本”,可以为网络运维提供真实网络的数字化验证环境。基于数字孪生网络平台,现网实施的调整、维护、优化等变更操作,都可以在数字孪生网络中进行充分的试验和验证,并通过其反馈不断地评估、修正、优化操作方案,最大限度降低对真实网络的冲击。同时数字孪生网络还会实时记录数字孪生体的状态和行为,支持对历史的追溯和回放,从而在不影响网络运营的情况下完成预验证,极大地降低试错成本。
相比传统的仿真技术,数字孪生网络不只是静态的网络快照,它可以根据网络状态实时更新;还可以与AI技术相结合,自我学习,使数字孪生网络根据反馈结果自我演进,具备更高的真实性和可靠性。
广东电信云网预知系统基于华为网络数字地图提供的数字孪生技术打造而成,内嵌高精度仿真框架。仿真服务实时在线生成高精度镜像网络,以网络设备的变更配置、互联路由与流量作为输入,模拟网络协议、流量的状态和行为,仿真网络设备的路由表与转发表项,为网络变更风险评估提供真实、客观的基础数据。同时网络验证算法可以在设备的路由表、转发表及流量负载基础上,基于一定的规则使用CPV/DPV(Control Plane Verification/Data Plane Verification)对网络风险进行评估。其中CPV可对控制面路由数量变化(路由数量突升或突降)、路由可达性、路由可靠性(路由“黑洞”、路由环路)进行形式化求解验证。DPV可对网络转发面路径的形式求解验证。两项技术相辅相成,从而有效识别网络配置变更带来的风险,并能对错误配置进行有效识别和拦截。
业务割接等运维效率提升效果明显
广东电信云网预知系统在惠州新型城域网以及移动承载网完成仿真能力试点验证。在网络业务割接前模拟业务路由变化,割接方案涉及复杂IGP/BGP路由协议调整,存在路由环路风险,割接前通过云网预知系统完成割接方案评估验证,仿真网络协议以及流量流向的变化,最大程度避免了割接带来的业务安全风险,运维效率提升明显。
在业务割接前,通过云网预知系统高精度仿真框架提供的数字孪生算法对网络进行镜像分析,实时同步现网配置、现网流量以及网络路由等信息,自动生成1:1数字基线镜像网络。数字基线镜像网络支持“物理拓扑-路由-隧道-VPN-流”多层可视。
在业务割接中,输入网络业务调整涉及的配置变更信息。配置发生变更后不会立即下发到实时网络,通过配置验证系统模拟实时网络将发生的变化,包括静态路由、BGP路由、业务流量流向等,通过图表和拓扑进行展示,变更信息一目了然。如果割接中规划的配置变更信息存在风险或问题,可以及时发现,而不是对现网产生影响后才被发现。
通过配置验证系统仿真的网络变化信息,确认与预期一致后再下发至网络,最大程度减少配置变更可能给网络带来的风险,提升日常运维效率。
有效守护IP网络安全经济效益可观
广东电信携手华为完成云网预知系统试点,有效防止错误配置进入现网,在减少网络故障方面取得了显著效果。针对IP网络传统配置变更流程无法预知对网络影响的顽疾,该系统的提前预防措施将准确率提升80%以上,方案具备通用性,可规模推广。通信领域涉及场景众多,IP网络承载大量的用户和业务(以中国电信为例,全国移动用户数3.72亿,有线宽带用户数1.70亿),近几年国内外发生的网络事故造成直接经济损失达到数亿乃至数十亿元人民币,间接损失更是无法估量。该方案可有效守护IP领域网络安全,避免潜在问题和风险引发的损失,经济效益可观。
结束语
数字化、智能化和绿色低碳正在推动新一轮科技革命和产业变革。数字化是实现网络自动化执行能力的基本前提,为网络状态感知、分析,以及AI训练与推理活动提供网络数据。过去三十年中,电信网络一直在进行业务数字化变革,随着5G网络的演进及AI的引入,原有网络数字化模型需要面向网络新业务和场景,进一步扩充与演进。
广东电信携手华为完成云网预知系统的试点,为业界树立了新标杆,向自智网络迈出了关键一步。该方案极大地提升了运维效率,彰显了中国电信在网络智能运维领域的领先技术实力,以及面向未来持续推进自智网络发展的技术创新力和领导力。未来,广东电信还将在IP网络运维自智方面进一步探索创新,持续提升网络运维的自动化、智能化水平,助力大湾区乃至全国数字经济蓬勃发展。