5G网络建设逐步步入“深水区”,这对网络维护能力提出了更高要求。传统的网络运维模式存在主动维护意识弱、故障交织诊断难、技术支撑响应慢等问题,而面对提升网络质量和降低运营成本的双重压力,行业需加快推进网络运营维护的数智化转型,提升网络运行的自动化、智能化水平,因此打造智能化移动通信网络运维解决方案势在必行。安徽移动通过开展故障隐患预防预测、故障智能压缩诊断、AR辅助运维等能力的研究及应用,强化高质量发展支撑,锻造5G精品基础网络。
提运维效率,保网络平安
安徽移动提出基于“AI+AR”的智能化移动通信网络运维解决方案,通过智能“三步走”(如图1所示),即隐患早发现、故障诊断准、问题解决快,抓实抓细抓好移动通信网络运维的各个环节,打造坚实稳固的运营商基础网络。故障隐患预防预测借助AI特征挖掘预测潜在的网络隐患,指导企业提前处理以规避严重故障。故障智能压缩诊断基于AI算法自学习与告警间的关联关系搭建“故障树”模型,智能诊断故障“根因”,指导企业快速维护处理。AR辅助运维则解放劳动力,帮助企业利用AR人机交互完成机房巡检、故障排查、资源核对等工作,监管“最后一公里”运维质量。
图1 安徽移动智能“三步走”运维解决方案
故障隐患预防预测
该方案基于基站历史告警、性能指标、OMC日志等大数据信息,AI建模训练出基站异常检测模型,及时发现高温隐患、前传光链路隐患、退服隐患等设备潜在问题,提前介入处理并减少严重故障的发生。例如对单板温度日志、机房工参、风扇转速等数据进行特征挖掘,基于ARIMA算法预测单板温度变化趋势,通过离群识别技术提前预警高温隐患。再如对光口收发光功率、光模块型号、前传距离、偏置电流等数据进行特征挖掘,通过自动编码器进行特征降维和异常链路筛选,构建LightGBM模型预测光路隐患(如图2所示)。
图2 隐患预测能力实现原理
故障智能压缩诊断
该方案基于E-FP Growth算法挖掘告警频繁项,通过告警时空关联性计算,挖掘各类告警同现概率,识别与同一故障关联的相关告警,进而发现根源告警。而后,基于告警因果逻辑等推理关系,借助专家经验及随机森林算法搭建“故障树”模型,将根源告警与告警“故障树”进行规则匹配,智能定位故障“根因”,输出故障处理建议,支撑一线维护人员进行故障处理。AR辅助运维该方案基于深度学习目标检测进行AR智能巡检,依托AR设备巡检的向导式自动扫描,通过语音和图像引导人员执行检查项,实时识别设备隐患。结合OCR文字识别、二维码识别,构建空间、物理、逻辑、业务四维一体的网络资源体系,实现资源数据“保鲜”闭环。打造交互式辅助排障,基于虚拟技术的前后台协同,将故障拓扑可视化,快速引入专家经验,引导用户便捷排障,有效支撑现场工作人员处理问题。
现网部署:“三步走”方案成效显著
据悉,智能“三步走”运维解决方案已在安徽移动现网部署,云侧智能识别网络隐患、诊断故障“根因”,端侧同步部署AR机房巡检、AR辅助排障等能力,云端协同使能故障端到端自动化处理,覆盖事前、事中、事后不同时间节点,助力企业每年节约数百万元运维成本。
事前隐患排查,提前规避故障风险。隐患预防预测方案的高温预测准确度达85%,平均提前5.4天识别高温隐患,使夏季设备退服率降低3%。前传故障预测和前传隐患预防识别准确率达87%,业务受损时长平均减少10%。
事中“根因”定位,精准识别故障原因。故障智能诊断方案将基于告警的派单机制升级为基于故障“根因”的派单机制,将同一故障触发的多条告警融合为1张故障工单派发,并将故障“根因”挂接在工单中,减少了25%的无效工单,使故障处理效率提升30%。
事后辅助运维,提效“最后一公里”。AR机房巡检解决方案已执行上万次机房巡检任务,巡检自动化率超过80%,巡检准确性达到85%,累计发现近千处隐患问题。AR辅助排障通过手机APP近端获取告警信息,可视化呈现故障拓扑,通过高效引导步骤,指导问题排查,使故障平均处理时长缩短20%。
打造永久在线的优质网络
将“AI+AR”技术引入移动通信网络运维中,为运营商打造智能化数字技术创新体系,进一步强化了数字中国建设的关键能力。安徽移动将继续把握数字化发展的历史机遇,紧抓大数据价值挖潜、AI注智赋能、算力驱动三个重点方向,拥抱数字经济新“蓝海”,为社会民生和工业智造打造永久在线的优质网络。