公司购买了很多安全设备,但安全运维人员还是需要面对很多无效告警,运营效率低下,有什么解决方案吗?

2025-03-19 22:24:20
推荐回答(1个)
回答1:

在传统的运维方式中,原始的事件里有许多重复性的、杂乱的噪音信息,而且某一个组件发生问题,往往会引发相关的组件都产生报警,这样在短时间内就会产生告警风暴,这也会严重影响运维人员的判断,因此传统的集中监控,都是依赖运维人员的经验梳理规则,并将事件归并、关联的规则运用于平台,实现告警抑制。这样就会出现你提问的这种情况,导致运营效率低下。

这时建议可以采用“智能运维”的手段,AIOps智能运维能够对传统集中监控进行智慧赋能,比如我们以擎创科技的夏洛克AIOps告警辨析中心为例,来展开分析这种AI赋能的几种方式:

1. 对既有的完全基于经验进行规则梳理的处理方式的智慧赋能

2. 对事件的精细化分析能力的智慧赋能

3. 通过建立人工和智能相融合的迭代反馈机制促使监控持续优化

综上所述,集中监控作为运维的“双眼”,应该是AIOps智慧赋能的第一站,赋能后的智能化集中监控将具备三大优势:

  • 能够以更低的人力成本更及时有效地发现问题端倪,提高了业务保障能力;

  • 能够更深入的洞察和分析告警,提升了故障排查效能;

  • 能够利用人机融合的智慧,建立持续改进的机制,并且为进一步进行基础指标监控以及日志分析等其他领域的智能化改造提供了指导方向。