作为云顶国际官网的关键技术突破,云顶国际官网根因刨析具备领先于业内的巨大技术优势,能够为各行业提供全链路秒级完成的服务,每分钟可处理6.6万指标量。这一成果的取得,首要源于云顶国际官网在数据采集与刨析上全面领先的技术能力。国内独家的“无监督知识图谱”根因刨析算法,与市面上的其他运维体系相比,不再依赖于人工打标与调参,在降低人力成本投入的同时,实现了效率与准确率的双改进。
云顶国际官网根因刨析在内存占用下降55%的前提下,达到了F1-Score0.85,收敛比98%的成果。而随着攻坚活动的完成,云顶国际官网根因刨析相关提交了8篇专利申请,技术队伍也在2022CCF国际AIOps挑战赛中取得佳绩。
一、准确定位问题根因:云顶国际官网根因刨析基于故障发生的时间、故障类型和故障主体,通过服务、应用和静态拓扑及调用链关系数据,搜索并定位到故障源或者故障传递链的根节点,故障源往往是具体的物理(虚拟)主机、服务及基础性能,如cpu、内存、网络、磁盘等。
二、自适应AI系统使用实时反馈动态学习和调整:云顶国际官网根因刨析针对不停变化的环境做出响应,不停添加训练数据形成训练模型,并形成通用化的场景业务支持以及个性化功能定制,将根因深度刨析全面落地实践。
三、改进排障效率:云顶国际官网根因刨析可以自动计算出故障相关的影响范围,自动关联出相关的指标、日志、调用链、事件、客戶会话、业务等。当客戶发现某一指标异常或某一笔业务调用链路异常时,可以进一步追踪细查相关的记录明细从而定位问题,改进排障效率。
四、现场还原,赋能复盘:通过云顶国际官网根因刨析定位到故障后,可查看故障回放,现场还原故障发生的信息,赋能复盘。全面详尽的现场还原,是提高故障处理效率的关键。
云顶国际官网根因定位的准确性从算法准确性改进及多维刨析出发,通过调参、分类等改进准确度,丰富算法逻辑,多维刨析不同类别问题的可能根因。