告警引擎
告警引擎有助于确定网络资源是否有问题。告警引擎应用在通过资源监控获得的数据上定义的条件,并决定将资源(监视器)的状态标记为停机、严重、故障或正常。可以在阈值和可用性和通知配置文件中配置此正常运行时间检查。
互联网服务监控
网站、Web 应用程序、DNS、FTP 等监视器被归类为 Internet 服务监视器。对于这些监视器,告警引擎从多个位置监视性能和可用性。此外,Site24x7 通过应用“误报保护器”消除误报。
每当检测到停机时间时,Site24x7 通过真实浏览器截取屏幕以进行网站检查。为了消除网络故障,Site24x7 将寻找在同一时期内可用的任何其他监控资源。如果任何其他监视器启动,它将断定该特定监视器已关闭并触发告警。如果没有收到任何其他监视器的启动通知,Site24x7 会检查已知网站的可访问性并确定网络状态。此外,当浏览器抛出的错误代码返回网站停机时间时,告警引擎会从其他全球位置(辅助)检查它们,然后确认网站是否停机。当网站被标记为停机时,每分钟都会进行持续监控以减少停机时间。
性能阈值
除了正常运行时间监控,Site24x7 还检查您的资源的性能,验证响应,并通过发送故障、严重、停机等严重性状态通知是否检测到任何问题。告警引擎确保数据的有效性,以便可以采取纠正措施当您的网页中存在或不存在特定关键字时。例如,“异常”、“错误”、“页面没有找到”等关键字出现在网页中时会触发告警。Site24x7 还会检查站点中是否存在由脚本(JSP 或 ASP)生成或从后端服务器输出的非静态关键字,并且还会在对网页进行未经授权的更改时触发告警。
Site24x7 对内置服务器的响应时间 URL、CPU 和内存利用率等一些指标具有智能告警。
故障或危急状态是根据以下提到的条件生成的:
高级阈值设置(策略):
阈值和可用性配置文件有助于告警引擎 决定是否必须将特定资源声明为危急或故障。配置停机规则以减少监视器的错误告警。各个监视器具有可以配置的唯一阈值集。一旦定义,阈值配置文件可以与监视器相关联,以在超出设置的阈值时触发故障或危急告警。使用高级阈值设置,您甚至可以为所有参数设置故障或危急告警条件。例如,您可以为主要和次要位置的响应时间峰值配置阈值。轮询计数用作验证阈值违规的默认策略。您可以通过对指定的阈值策略应用多个条件(>、<、>=、<=)来验证阈值违规。监视器的状态更改为“故障或危急”” 当适用于以下任何阈值策略的条件成立时:
- 在轮询计数期间验证的阈值条件(轮询次数):当应用到阈值的条件针对指定的“轮询计数”持续验证时,监视器的状态变为故障或危急。
- 轮询计数期间的平均值(轮询次数) :当属性值的平均值(对于配置的轮询次数)连续证明应用于阈值的条件时,监视器的状态变为故障或危急。
- 在持续时间内验证的条件(以分钟为单位) :当连续验证应用于阈值的指定条件时,对于所有轮询,在配置的持续时间内,监视器的状态变为故障或危急。
- 持续时间内的平均值(以分钟为单位):当属性值的平均值在配置的持续时间内持续证明应用于阈值的条件时,监视器的状态变为故障或危急。
要了解告警引擎如何监控您的服务器正常运行时间,请参阅此处。
服务器停机期间生成的 RCA 报表的电子邮件示例