版权归原作者所有,如有侵权,请联系我们

[科普中国]-告警状态

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

定义

在网络管理领域,故障被定义为产生功能异常的原因,是产生告警事件的原因。告警是在特定事件发生时被管对象发出的通报构成的一种事件报告,用于传递告警信息。它是生产厂商定义好的,并且是通过网络中的设备产生的,是一个系统发出的消息,表示其发生了某种事情或异常,最终被网络管理人员观察到。

理想的告警信息应包含有关故障设备名称、故障症状、发生部位、发生时间、发生原因等信息。但绝大部分告警都只有有关经历故障的设备名称、故障症状、发生时间等数据域,而没有提供识别故障必须的故障发生的详细地点和发生原因等数据域。1

告警状态变化告警状态的变化是由于接收到相关的事件和操作所致。如当接收到一个告警触发消息则产生一条未恢复未确认的告警,随后又收到该告警的恢复消息,则这条告警就从未恢复未确认状态自动转为己恢复未确认状态(网管监控人员未对该告警作确认操作),同时从当前告警库转入历史告警库。1

告警状态分类告警分为五级:紧急告警( critical )、主要告警(major)、次要告警(minor)、警告告警( warning )、不确定告警( indeterminate )。如动力环境的交流停电告警为紧急告警,数据的设备CPU利用率超过门限值告警为重要告警,动力环境的风扇故障为次要告警,门禁、门开告警为警告告警。1

告警逻辑与关联信息通信网络具有复杂、层次化的组网和全程端到端等特点,以SDH传输网为例,其网元的基本类型有终端复用器、分插复用器、再生中继器、同步数字交叉连接设备等,这些网元的出现在物理和逻辑上都存在一定的关联性,网络中的独立网元故障将导致关联网元的“一点告警、多点传播”效应,而这些告警之间存在着发生时间和名称逻辑上的关联。在关联分析中,首先将干扰告警进行人工剔除,如将大量信号类告警(信号劣化指示、输出信号丢失等告警)中的非相关告警(如门禁开启、主备单板版本不匹配等告警)剔除。在此筛选过程中,要兼顾重复告警可能由不同时间段的不同故障引起,不可盲目将重复告警删除,而应该结合实际故障情况进行分析甄别。因此,将此类告警进行关联归类合并处理,将大大提高集中监控效能。

网络设备内的告警逻辑相关性分类如下:

1.压缩处理,将多个具有同属性(同小区、同网元、同光路等)且同时发生的告警压缩成一条告警;

2.过滤机制,剔除不符合属性相关性条件的告警;

3.累计计算,将一定数量同时发生的告警转换为新名称的告警;

4.告警抑制屏蔽,当高优先级告警产生时,则抑制低优先级告警;

5.布尔运算,将符合一定布尔运算规则的告警合称为一个告警;

6.告警泛化.通过更笼统的告警信息替换网元生成告警信息;

7.告警特化通过更详细的告警信息替换网元生成告警信息;

8.时序关系不同的告警按照一定的时间顺序生成。

网络设备间的告警关联分类方式有:衍生关联,基于告警间的产生关系划分为根告警和衍生告警;拓扑关联,基于网元拓扑连接关系,构成本端告警与对端告警;时间关联,同一故障点产生告警,具有同时间点触发特性;因果关联,由于A告警发生导致B告警触发,如光缆阻断导致EMS网元脱管;链路关联,汇聚线路出现故障,触发整个路径网元设备告警并形成归一化派单。网络设备内部、网络设备之间的告警逻辑关系如图1所示:2

算法告警关联性分析算法包括神经网络算法、模糊逻辑算法、基于规则方法、数据挖掘算法等。

数据挖掘算法中,关联规则的核心算法是Agrawal R等人提出的Aproiri算法,Mannila H等人对关联规则发现算法进行理论推广,提出了时间序列中的频繁情节发现算法,即WINEPI算法。告警关联研究和应用在此基础上已取得了一些研究成果,如凌绪雄通过频繁模式(Apriori算法、FP-Growth算法、NHTFPG算法)和序列模式(WINEPI算法)挖掘系统,比较了算法性能并分析了爱立信MSC,MGW ,BSC网元告警之间的相关性;安欢结合置信度分析了关联模型(Apriori算法)和序列模型挖掘告警信息的价值,但在根据告警重要程度赋予权值大小和实时分析方而仍有待研究;徐前方等人基于图论思想,利用相关度和置信度框架构建告警关联关系,结合电信网络告警测试MTAP算法,得出其在压缩比、规则数量方而具有更高的有效性;吴简等人将动态模糊关联规则挖掘(IDFARM)算法应用于光网络故障管理.进一步缩短故障分析判断的时长。2