|
|
51CTO旗下网站
|
|
移步端
创造专栏

中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

为了优化网络运维的上班模式,提升网络运维准确性及效率性,谈起集中维护支撑服务项目,基于必发娱乐手机版(Artificial Intelligence)的运维解决方案旨在强调实现以保护为骨干,依托大数据挖掘技术与深度学习算法, 贯彻问题早发现,由被动处理问题改为主动预防问题,故而增强整体资源之兑换率和保护效率。

笔者:张洪伟 王西点| 2020-01-07 10:23

01、概述

在运营商传统网络运维中,巡检、告警分析、故障处理等工作长期积累了丰富的阅历,他总产值并未把充分挖掘。同时,脚下的人为运维存在系统复杂耦合度高、数量来源多种多样、事在人为维护风险度高,修复间隔时间过长、人口培训难度大等现状,导致了性能相关告警不明显、无效告警筛查规则缺失、故障维护只能被动解决,多极化/保护工单重复派发等问题,影响网络运维的频率和财力。为了优化网络运维的上班模式,提升网络运维准确性及效率性,谈起集中维护支撑服务项目,基于必发娱乐手机版(Artificial Intelligence)的运维解决方案旨在强调实现以保护为骨干,依托大数据挖掘技术与深度学习算法, 贯彻问题早发现,由被动处理问题改为主动预防问题,故而增强整体资源之兑换率和保护效率。

02 、基于必发娱乐手机版(AI)基本算法

2.1 聚类算法(KMeans)

穿过对多维度求欧拉相差(或余弦距离),不断的迭代对隐患进行聚类,找到关键核心点的性状进行隐患挖掘。K-Means书法是基于多维度距离的聚类算法,穿过设置参数K,名将样本点分为K个致密且独立的簇,每个簇由与簇的质量心欧拉相差靠近的样本点组成。

计算步骤:

  • 随机选取K个中心点遍历所有数据,名将每个数据划分到最近的中心点中
  • 计算每个聚类的总产,并作为新的中心点
  • 重温2-3,直到这k个中线点不再变化(收敛了),或施行了足够多之迭代
  • 以每个基站作为样本点,以他性质指标参数及历史告警类别和频次作为特色,对一切有告警基站进行K-Means聚类,穿过不断迭代将将告警类型依据相似特性指标进行聚类,深入开掘各类告警的严重性核心特征,表现基站画像、隐患挖掘与管理的根基。

    2.2 正常分类算法(逻辑回归,KNN,决定树,随机森林)

    穿过把相似隐患进行合并,可以对隐患进行分级,故而方便查找隐患的派别。正常分类算法是有监督的机器学习算法,对于给定的对象类别,名将样本进行分类。

  • 逻辑回归:基于Sigmoid函数的多特征的二分类/多分类广义线性回归。穿过建立代价函数并应用梯度下降优化的主意,贯彻多样资产的分类。
  • KNN:K近些年邻(kNN,k-NearestNeighbor)列入算法是数据挖掘分类技术中最简单的主意之一。所谓K近些年邻,就是将每个样本分类为他最接近的k个样本的项目均值。
  • 决定树:决定树又称为判定树,是运用于分类的一种树结构,其中的每股内部节点代表对某一属性的一次测试,每条边代表一个测试结果,叶节点代表某个类或类的分布。决定树的裁决过程需要从决策树的脚节点开始,待测数据与核定树中的特征节点进行比较,并按照比较结果选择选择下一比较分支,直到叶子节点作为最终的裁决结果。
  • 随机森林:副样本集中选取n个样本,构建决策树,并重申这一步骤m先后形成m个决策树,穿过投票决定决定样本类别。
  • 以基站作为样本点,穿过分类方法可以将基站分为隐患基站和非隐患基站。穿过对隐患基站性能指标参数、基金信息、地理信息及告警类型级别作为特色,对基站告警隐患进行分级,确认基站隐患级别,贯彻对基站健康度打分。并可根据已训练好的机器学习模型对新样本进行例行度评估。贯彻设备状态预判。对于隐患级别高的基站进行重大关注,并将他对应的性质参数指标作为隐患基因统计进入隐患管理库。

    2.3 独特检测算法

    核密度估计(kernel density estimation)是在方法论中用来估计未知的刻度函数,属于非参数检验方法之一。所谓核密度估计,就是利用平滑的定价函数(“核”)来拟合观察到的多寡点,故而对实际的概率分布曲线进行模拟。

    核密度估计可用于进行异常检测,计算正常样本之外的突出分布可能性,用于异常数据分析、新鲜现象分析。对于形成画像的基站样本点,对于未发生告警的基站进行异常检测,可以发现性能指标相对于正常值(不会触发告警的性质值)发生偏离的样本点,动态自适应设定告警阀值,触发维护工单。使得预警,降低站点告警故障。

    2.4 深度置信网络(DBN)

    深度置信网络是一番概率生成模型,与俗的鉴别模型的神经网络相对,浮动模型是成立一个观察数据和标签之间的合并分布,对P(考察值|标签)和 P(标签|考察值)都做了评估。

    DBNs由多个受限玻尔兹曼机(Restricted Boltzmann Machines)层组成,一度典型的神经网络类型如图所示。该署网络被“限制”为一个可视层和一个隐层,层间存在连接,但层内的大片间不存在连接。隐层单元被教练去捕捉在可视层表现出来的高阶数据的实质性。深度置信网络可以用于样本目标的数值预测以及样本类别的分类。

    对于样本类别的分类,与健康分类算法应用相似。贯彻基站告警隐患分级,康度打分。并可根据已训练好的机器学习模型对新样本进行例行度评估。贯彻设备状态预判。

    对于样本目标的预测值,穿过深度置信网络实现基站特征异常概率分析等效果。 针对网络性能指标特征的突出状态,拓展概率预判,即尝试对“亚健康”网络进行预判。 预先判断网络问题,调减投诉和总体性告警、装备故障实际发生之概率。

    2.5 堆叠自动编码器(SAE)

    自编码器(AutoEncoder)是一种无监督的读书算法,重点用于数据的降维或者特征的抽取。autoencoder穿过深度置信网络进行预训练,故而确定网络权值之初始值。他目标是让输入值等于输出值。第一用网络权值矩阵对输入进行编码,历经激活函数后,再用矩阵转置进行解码,故而有效输出数据等于输入。该过程可以看作是对输入数据的回落编码,名将高维之原始数据用低维的发行量表示,使压缩后的低维向量能保留输入数据的杰出特征。

    为兑现智能站点画像,要求对联系点的性质指标,基金信息,地理信息,历史告警信息等多维特征进行梳理。穿过自编码器可以对大气特征进行梳理并降维,末了形成构成基站健康度指标的多维特征,可对后期的突出检测,告警预测,隐患管理降低输入数据维度,降低计算成本。

    2.6 循环神经网络(RNN)

    循环神经网络可用于时间序列相关的样本取值预测。在风的神经网络模型中,是副投入层到隐含层再到输出层,层与层之间是全连接的,每层之间的兴奋点是现代化连接的。RNNs从而称为循环神经网路,即一个队当前的进出口与前面的进出口也有关。现实的显示形式为网络会对前面的消息进行记忆并应用于当前进出口的算计中,即隐藏层之间的兴奋点不再脸谱化连接而是有连接的,并且隐藏层的涌入不仅包括输入层的进出口还包括上时代刻隐藏层的进出口。理论上,RNNs能够对其它长度的队数据进行拍卖。

    03 、头到头运维功能架构

    3.1 网络运营中心NOC

    头到头的运维架构主要由两大一部分构成:网络运营中心NOC(Network Operation Center)和实地外线。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 1. end to end operational architecture
    希冀1.头到头运维功能架构

    NOC(网络运营中心)是促成远程实时监控服务运营和监测设备状况的商业化中心,重点涉及运维设计、运维监控、故障分析、诊断测试等几大功效模块,可结合运营商EOMS(Electric Operation Maintenance System)电子运维系统开展任务工单派发,名将NOC嵌入现有运维流程可提高相关技术、流程、集团及管理效率,进而提升网络与服务的祥和与可预见性。

    现场外线主要是承载、拍卖、闭环EMOS电子运维系统所派发任务工单,包括现场维护人员的天职调度、能源配置及最终的排练障巡检。

    3.1.1 运维设计功能

    运维设计功能主要包括两部分功能设计:运维规则设计与AI援助规则设计。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 2. design function of operation and maintenance
    希冀2.运维设计功能

    其中运维规则设计主要来源于运营商长期积累的相关运维经验,制订分析规则、诊断规则、派发规则、安排规则、激活规则等,名将上述规则应用于可视化设计分析中,为实用化运维提供快捷设计能力。

    AI援助规则设计则是由传统艺术专家进行规范设计转变为通过AI艺术援助进行根因规则设计。名将相关网元类型、告警类型、告警信息、告警码、位置信息等行为输入项,穿过神经网络相关算法最终输出AI援助规则。

    3.1.2 运维监控功能

    穿过对数据源、数据表等分析进行场景监控设计,可视化呈现多系统、多界面的监察。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 3. operation and maintenance monitoring function
    希冀3.运维监控功能

    气象运维监控可对网络全景监控,也可选择性针对主题监控,研制适合实际需要之最大化监控功能。名将之前被动运维、基本无故障预测转变为隐患故障可预测及规避。

    3.1.3 故障分析功能

    穿过部署RCA(RootCauseAnalysis)重点原因分析规则挖掘工具,根据算法学习出固有规律,形成规则放入RCA官方展开告警根因查看和告警抑制压减。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 4. fault analysis function
    希冀4.故障分析功能

    再结合性能指标、数配置、相关变更情况、题材日志等展开多源关联分析,故而对故障进一步肯定,增长故障分析的准确性及效率性。

    3.1.4诊断测试功能

    诊断测试功能主要包含人工诊断指令及机关诊断脚本两部分。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 5. diagnostic test function
    希冀5.诊断测试功能

    第一通过人为诊断指令下发至EMS,再由EMS举报诊断结果至人工诊断指令部分;机动诊断脚本可批量生成指令,再由EMS举报上报相关诊断报告,名将诊断结果或诊断报告中独特问题自动创建维护工单并派出现场处理,付出现场工单管理,拓展继续流程处理。

    3.1.5工单派发功能

    工单关联RCA的关系规则,拓展根故障派单,子故障合并派单,概括考虑网络拓扑、运维经验等信息,例如同一基站下所有小区退服,则合并为一个作业工单,副源头削减派单量,增长故障解决效率。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 6. distribution function of work lists
    希冀6.工单派发功能

    T1告警消除最大量时间点,T2为关联指派时间点,T3为告警派发最长时限,穿过分析历史告警,送出最佳关联时间点阈值,调减消除告警的无效派单量,穿过关联减少派单总量,提升运维效率,穿过动态设置派单时间阈值,增长合并派单,调减无效派单、重温派单。

    3.2 现场外线配合

    3.2.1 故障单处理

    集中故障告警平台针对告警监控进行结果输出,在创造TT(Trouble Ticket)工单之前,要求等待一定告警清除时间,避免相关工单追回。顶系统收到TT的报警清楚消息后,可以自行关闭TT单和相对应的WO(Work Order)另一方面。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 7. fault single processing
    希冀7.故障单处理

    穿过运维经验和对历史工单进行机器学习、钻井工单相关性规则,起先策略归并重复工单,剔除无效工单。

    3.2.2 任务及资源配置

    对于外部系统派发的TT另一方面,在少数应用场景下,不需要相关分析处理,可以直接派发至外场工程师处进行解决。对于这种应用场景,系统提供TT另一方面自动受理并派发子单的效应。顶系统接收到TT单时,机动以系统超级用户来受理TT另一方面,下一场进行拍卖,在拍卖该步骤时可自动选择生成WO另一方面,并生成子单。智能调度主要是将任务通过AI安排引擎进行工单计划制订、位置及路线规划、职工能力及工具需求分析,把任务与资源相结合达到最佳匹配效果。交通过人员调度、能源配置、途径规划等可实现工单“京”时光指派、客观配置人员工作职责量,提升派单准确率、提升平均工单响应时长及资源利用效率。

    3.2.3 机动巡检管理

    机动巡检管理主要涉及巡检配置管理、巡检规则管理、巡检任务列表、指令适配/推行及机关输出巡检报告功能。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 8. automatic inspection management
    希冀8.机动巡检管理
  • 巡检配置管理包括基础数据配置管理、装备网元配置管理、任务/提案管理及门限管理/通告管理。
  • 巡检规则管理是为制定相关巡检规则(专业网信息、作业计划)等以及配置解析规则。
  • 巡检任务列表可对巡检计划接口定义、巡检定时任务、巡检任务列表查看。
  • 指令适配及实施由自动巡检功能发现维护类问题,穿过模板初始化规则及指令创建规则生成巡检测试工单,再与指令模板进行匹配映射创建巡检任务,指令执行后将指令结果反馈闭环输出巡检报告。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 9. automatic inspection process
    希冀9.机动巡检流程

    名将相关维护要求结合站点资产信息;历史数据包含告警次数、故障处理次数、试点话务量、数量量等信息;地理位置、区域、形势特征(高山、平川、河岸、洼地等)、耐候性;场景部门输出的相关天气数据,共同制定动态巡检计划,聚焦故障高发站点,再接再厉预防历史故障重发,调减维护资源之浪费。

    3.2.4 隐患管理

    隐患管理主要针对异常项目生成智能巡检告警,机动完成对告警信息的剖析,机动生成维护作业计划告警工单,保护人员根据隐患工单来处理隐患问题。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 10. intelligent inspection
    希冀10.智能巡检

    在巡检设备上(钟塔、基站等),放置NFC(Near Field Communication)标签,穿过近距离无线通讯技术,巡检人员按照路线的安装,依次到每个地方进行巡检,机动显示巡检内容并根据需要填写巡检的情节。

    04 、头到头运维软件架构

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 11. end to end operation software architecture
    希冀11.头到头运维软件架构

    头到头运维系统软件架构主要包括5个组成部分,原始数据、数量ETL(Extract-Transform-Load)、数量存储和后台业务处理、工作处理控制、工作展现层。

    其中原始数据可通过北向平台、EOMS工单系统、代维基金管理系统、动环检测系统及外部相关API接口数据(农田水利天气数据信息)。穿过数据ETL拍卖用来将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端,副数据源抽取出所需的多寡,历经数据清洗,末了按照预先定义好的多寡仓库模型,名将数据加载到数据仓库中扮。名将相关数据存储至Hadoop集群中,穿过AI平台算法及力量(聚类算法、正常分类算法、独特检测算法、深度置信网络、堆叠自动编码器、循环神经网络等)重组专家知识库进行智能任务调度及后台业务处理。工作处理控制主要细化各模块功能,穿过相关工作逻辑中间件实现模块功能。工作展现层,基于前端公共模块相关技术对联系点画像、区域画像、隐患管理、地理化分析等范畴化呈现。

    05 、基于AI的运维实施应用

    5.1 试点画像

    穿过学习借鉴互联网用户画像技术,基于多维网络运维数据,引入AI特色画像和特殊检测算法、进出口网络特征的定居点画像,为智能运维各模块提供全景式特征画像和数量支撑,贯彻隐患站点分级标签化。构成系统自身大量之多渠道、多维度的根基数据作为输入,穿过制度化监督学习算法进行聚类及异常检测,进出口具有网络特征的定居点画像标签及指标异常站点列表。

    (1)试点健康度评估

    基于站点设备档次、性能情况结合站点环境、停车状态、备电时长、试点历史故障等信息建立联系点健康度评估指标体系,并设定告警阈值自动触发维护工单,并有效预警,降低站点告警故障。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 12. site health assessment
    希冀12.试点健康度评估

    (2)区域可视化

    利用多种世维指标和落脚点客观运行指标,可以实现区域综合可视化,以区域为目标,提供整体指标统计分析,用于运维提升支撑。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 13. Table evaluation of regional indicators
    希冀13. 区域指标评估评估

    (3)试点维护本分析

    穿过对历史故障维护数据包括维护人员、车辆、成像机、故障发生频率等信息提供站点维护本数据;为过程成本量化、试点维护预算及后续投标成本核算提供多少支撑。

    采取AI书法实现告警智能分类,针对现实故障提供智能决策,提醒运维人员故障处理,确立员工与工单之间的光照,贯彻工单精准指派,调减工单派发数量,提升工单派发质量,同时联系APP,缩短故障恢复时长。到达“降成本增效”的目的。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 14. Maintenance process management
    希冀14 .保护过程管理

    (4)制订站点维护计划

    基于站点重要级别、历史故障信息、天道现象等制定维护计划;对保护备件提供预测管理并减少站点故障率,降低单站维护本。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 15. Site maintenance plan management
    希冀15 .试点维护计划管理

    5.2运维效率分析

    (1)GIS基金全景图

    对水源信息(人口、车辆、试点、成像机)拓展实时位置展示,工单关联、轨道回放;实时了解资源状况,富有调度管理。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 16.GIS asset panorama
    希冀16.GIS基金全景图

    (2)“赛马”Dashboard

    穿过现场大屏监控对项目基础维护信息、人口效率指标、车辆效率指标、成像机效率指标进行实时和动向分析呈现,监控中心随时了解项目整体效率情况及区域赛马情况。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 17. monitoring information on large screen
    希冀17.现场大屏监控信息

    (3)人口效率指标分析

    对人员工单效率指标进行统计分析,包括上站任务详细信息及工作时长信息;对车辆效率指标分析,包括上站里程、计划里程分析;意识人员运维效率短板进行改进,提升效率。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Table 1. overall statistical data for efficiency indicators
    表面1. 效率指标总体统计数据

    (4)APP掌上运维

    管理人员可通过移动APP使用实时掌握了解项目运维情况及人员效率情况,并为管理人员提供实时运维决策效率数据支撑。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 18.APP management cockpit
    希冀18.APP掌上运维

    (5)故障预测

    过去运维工作都是在开展大量之事后处理工作,如今,穿过运维专家梳理,分选动力环境、历史工单、网络性能、天道停电、故常告警、概括资管等多个维度特征,构建训练数据集。同时,咱们挑选了多种AI模型进行对照测试,末了确定选用多层LSTM循环神经网络实现小区退服告警预测,以达到故障预警分析的目的,贯彻了变被动处理为积极预防的运维思路转变,摆脱“救火队员”的运维状态,到达对故障的前面预判。

    中华移动设计院:基于大数量的必发娱乐手机版运维服务支撑方案

    Figure 19. Fault prediction
    希冀19.故障预测

    06 、总结

    穿过运营商网络部、网管、分公司、县公司一线维护人员目标使用者,基于必发娱乐手机版(AI)的运维解决方案,可提高维护效率和力量,预防性主动运维能力、很快响应的报告能力、很快应变处理能力、电气化减少人为工作量、经历移植减低人员要求、支持市场前线的分级保障能力。使平台融入运维生产中,贯彻商业目标。

    【本文为51CTO专栏作者“移步Labs”原创稿件,转载请联系原作者】

    戳这里,瞧该作者更多好文

    【编纂推荐】

    1. 玩转大数量开发工具(内外全篇)
    2. 2020年不可不知之十大大数据技术
    3. 大数量的数据仓库分层
    4. 在人工资源工作中拥抱大数量的九大利益
    5. 大数量应用“卡”那里了?
    【义务编辑: 未丽燕 TEL:(010)68476606】

    点赞 0
  • 大数量  必发娱乐手机版  运维
  • 分享:
    大家都在看
    猜你喜欢

  • 
       
       
       
       

    
       
    <sup id="fc950d43"></sup>
    1.