Site24x7 告警邮件
在以下情况下,告警电子邮件将发送到与监视器状态关联的用户组:
- Site24x7 将监视器识别为已关闭。
- 与监视器相关的属性超过了配置的阈值。例如,当服务器的 CPU 使用率超过 75% 并且配置的阈值为 57% 时。
- Site24x7 确认已识别的错误已得到纠正,并且监视器已恢复到完美状态。
要通过电子邮件接收通知,您可以配置告警电子邮件设置。来自 Site24x7 的告警电子邮件将包含以下详细信息:
1. 主题:告警电子邮件的主题将包括监视器的名称、发送电子邮件的原因以及监视器的状态。
2.将包含:
- 监视器名称:被监控的资源的名称以及触发告警电子邮件的原因。示例:对于APM 监视器,应用程序级告警电子邮件将提及应用程序名称,而实例级告警电子邮件将同时提及应用程序名称和实例名称来代替监视器名称。
- 监视器状态:特定监视器的当前状态。
- 时间和日期:发现问题的数据收集时间。
3. 属性改变:当前监控失败的原因。例如,当服务器监视器的 CPU 利用率超过 90% 的阈值时,将触发一封告警电子邮件,其中 CPU 利用率超过 90%,因为属性发生了变化。
4. 现有属性问题(未解决):之前确定的未解决问题将列为现有属性问题。例如,假设服务器 的内存使用率超过了给定的 90% 阈值,而 CPU 使用率已经超过了配置的 80% 值并且一直未解决。在这种情况下,发送的告警邮件将内存利用率超过 90% 作为属性更改,并且 CPU 利用率超过 80% 作为现有属性问题(未解决)。
5. 监视器组:特定监视器所属的监视器组。父监视器组和子组都将在此处列出。
6. 标签:将列出与监视器关联的标签。例如,在AWS 监视器的情况下,与监视器关联的标签将在告警电子邮件中提及。
7. 最近的轮询:从最近的五次轮询中收集的数据,以及每次轮询的时间。该数据将反映来自监视器的性能指标趋势,以确定它是一个缓慢发展的问题还是一个突然的问题。
8.最近三天的可用性汇总报表。此数据可用于了解状态是否经常波动或是否是新问题。
9.性能报表过去三个小时。此数据可以提供有关同一资源的任何其他关联属性最近是否出现问题的见解,这可能导致当前的性能问题或停机。
10. 查看在线报表:点击此选项可以查看监控汇总仪表盘的公开报表。您无需登录即可查看此内容。
11. 告诉我们这是否是虚假告警:如果您认为当前的告警是虚假的,您也可以提交报告。此页面还将提供 Site24x7 提供的数据,以证实资源被确认为关闭的原因。
应用程序性能监控 (APM)
在来自 APM 的告警电子邮件中,将使用实例名称或应用程序名称而不是监视器名称。
AWS 监控
与 AWS 监控相关的告警电子邮件还将包括:
1. 状态检查:状态检查将包含在 EC2 实例、EC2 Auto Scaling 组和 Lightsail 实例的告警电子邮件中。这些有助于检查资源的可用性。
2. 健康检查:健康检查将包含在 Elastic Beanstalk 的告警电子邮件中。这些有助于在引发告警后验证与资源映射的实例的健康状况。
3. 事件和 Cloudwatch 日志:仅适用于支持日志的监视器。这些有助于分析日志。
4. AWS 运行监控建议:如果资源在添加监视器后的 24 小时内终止,运行监控建议将与终止告警电子邮件一起发送。
5. IT 自动化建议:适当的 IT 自动化建议将与监视器停机告警电子邮件一起发送。
服务器监控
对于服务器监视器的告警电子邮件,将包括停机期间基于 CPU、服务和内存使用情况的排名靠前的进程。
在与流程状态更改相关的告警电子邮件中,主题将包括流程状态、服务,顶部区域将包括状态更改的日期和时间。它还将包括该过程的最近与轮询相关的指标。
网址监控
对于 URL 监控的告警电子邮件,该电子邮件将包括被监控的 URL、解析的 IP、屏幕截图或 HTML 响应(如果监视器由于内容检查中的任何异常而关闭)。