什么是监控中的 AIOps?
监控中的AIOps(IT 运营中的人工智能)是指人工智能、机器学习和数据分析的融合,使 IT 监控成为响应式、智能和敏捷的业务功能。AIOps 不是 DevOps 的替代品,而是一个很好的合作伙伴,它在与周期的每个阶段集成时提供智能见解。应用性能监控
AIOps 从来自不同 IT 应用程序的大量监控数据中提取可操作的见解,以全面、系统和主动地查看它们。AIOps 使企业所有者能够在由一系列 API 连接的分布式架构中跨 IT 基础架构的不同层(即混合云、微服务、虚拟机和容器)获得运营洞察力。
为什么要在监控中使用 AIOps?
IT 世界已经从本地大量的单体 IT 基础架构模型转变为动态可扩展且灵活的微服务和混合云部署世界。传统上,监控是一种与应用程序、机器或数据级别相关的零碎方法,而今天,监控与 DevOps 文化紧密结合。
此外,混合、多云架构需要节省时间和精力的自动化来进行持续监控,并在复杂 IT 环境中观察到的指标、日志和跟踪之间建立深度关联。借助 AIOps,IT 团队可以智能地捕获离散的监控数据,对其进行整体理解,并实施更改以调整 IT 堆栈以适应当前趋势。
借助 AIOps,DevOps 团队可以大幅缩短平均修复时间 (MTTR)、减少数据孤岛、理解分散和多样化的数据池、自动修复,并以最少的噪音(无意义和多余的数据)获得对技术堆栈的前所未有的可见性没有增加任何价值)。
Site24x7 和 AIOps
Site24x7 的多元 AI 算法研究监视器中的多个属性以动态发现异常,为其提供更丰富的上下文和目的来制定自动化决策。对于多个属性相关的基于代理的监控器,例如服务器、IIS 或 Hyper-V 监控,Site24x7 采用组合方法,有助于获得更准确的预测。例如,必须全面考虑 CPU 使用率、内存可用性、磁盘读取、磁盘写入和其他相关因素,以预测峰值或下降。
AIOps 带来的不同
在 AI 之前,通过研究以前轮询的数据来设置手动阈值,同时考虑其他配置的轮询策略(如果有)来设置警报。由于响应时间的变化,这种手动方法容易出现严重错误、误判和失误,包括不可预测的周末激增或中断以及不同的混合云堆栈。此外,由于静态阈值独立于历史数据,因此需要不断地重新访问它们以考虑监控指标的变化行为。当指标趋势发生真正变化时,基于 AI 的阈值配置文件无需手动更改。