11月09, 2020

苏宁基于知识图谱的大规模告警收敛和根因定位实践

一、概述

知识图谱有较强的知识表达能力、直观的信息呈现能力和较好的推理可解释性,因此知识图谱在推荐系统、问答系统、搜索引擎、医疗健康、生物制药等领域有着广泛的应用。

运维知识图谱构建相对于其他领域的知识图谱构建而言,具有天然的优势,网络设备固有的拓扑结构、系统应用的调用关系可以快速的构成软硬件知识图谱中的实体和关系。历史的告警数据蕴含着大量的相关、因果关系,使用因果发现算法,也可以有效的构建告警知识图谱。基于知识图谱上的权重进行路径搜索,可以给出根因的传播路径,便于运维人员快速的做出干预决策。

苏宁通过CMDB、调用链等数据构建软硬件知识图谱,在此基础上通过历史告警数据构建告警知识图谱,并最终应用知识图谱进行告警收敛和根因定位。本文主要包括运维知识图谱构建、知识图谱存储、告警收敛及根因定位等内容。

二、 痛点及产品对策演进

痛点

  1. 苏宁内部系统和服务的复杂性:

  • 6000+系统,数量还在增加;

  • 系统间调用方式复杂:大部分使用RSF,也有HTTP、HESSIAN等;

本文链接:https://blog.jnliok.com/post/kVCO7V7fdPkSkbN3hP2j.html

-- EOF --

Comments