AWS 资源的正常运行时间监控
Site24x7 为其 AWS 监视器提供正常运行时间监控,为每个监视器提供可用性状态和配置。启用正常运行时间监控的主要优势在于,它可以帮助您避免使用 CloudWatch API 调用来获取指标,从而降低您的 CloudWatch 成本。由于未获取 CloudWatch 指标,因此时间序列图表将不适用于每个监视器。
要记住的几个指示:
- 无法为 Amazon KMS 和 Amazon Certificate Manager 启用正常运行时间监控,因为它们本身不使用 CloudWatch API。
- 启用正常运行时间监视后,日志报表仅显示每个轮询频率的监视器状态。
视频
这是一个快速视频,解释了 AWS 正常运行时间监控的工作原理以及随之而来的指标:
配置正常运行时间监控
正常运行时间监控可以通过三种不同的方式进行配置:
编辑监视器
要通过编辑监视器来配置正常运行时间监控,请执行以下步骤:
- 在 Site24x7 控制台中,导航到监控 AWS 资源的 编辑监视器 Details 页面。
- 根据您的偏好切换禁用性能指标收集选项。
将操作定义为配置规则
按照初始步骤添加此处列出的配置规则。 从下拉列表中定义操作时,选择禁用性能指标收集并将值设置为 True。启用正常运行时间监控后,将反映更改。
使用标签
使用标签有效地为资源配置正常运行时间监控。将标签“uptime_site24x7”设置为 True,以便在发现期间或下一次数据收集时考虑对相应的 AWS 资源进行正常运行时间监控。
阈值配置
下面列出了在启用正常运行时间监控的情况下可以配置和通知的一组阈值。
阈值名称 | 监视器类型 | 可能的状态变化 |
---|---|---|
通知代理失败 | EC2 实例、Lightsail 实例 | 故障、故障、严重 |
状态检查失败通知 | EC2 实例 | 故障、故障、严重 |
通知 Auto Scaling 实例终止 | EC2 实例、Lightsail 实例 | 故障、故障、严重 |
通知 Spot 实例终止 | EC2 实例 | - |
通知计划实例终止 | EC2 实例 | - |
通知 EMR 实例终止 | EC2 实例 | - |
卷状态检查失败通知 | EC2 实例 | - |
当监控的资源出现停机/故障/严重时,通知为故障。 | Elastic Beanstalk、Lightsail LoadBalancer、EC2 Autoscaling、StepFunction、EMR、Neptune 集群、AMQ、Storage Gateway | 麻烦 |
当监控节点出现停机/故障/严重时,通知为故障。 | EKS 集群 | 麻烦 |
当监控的命名空间出现停机/故障/严重时,通知为故障。 | EKS 集群 | 麻烦 |
当实例不处于健康状态时通知为故障。 | Lightsail 负载均衡 | 麻烦 |
环境健康故障通知 | Elastic Beanstalk | 故障、故障、严重 |
环境健康状态警告通知 | Elastic Beanstalk | 故障、故障、严重 |
通知虚拟接口故障 | 直接联系 | 故障、故障、严重 |
通知隧道状态失败 | VPC-VPN | - |
接受的路线 | VPC-VPN | 故障,危急 |
主动服务 | ECS 集群 | 故障,危急 |
待处理的任务 | ECS集群、ECS集群服务 | 故障,危急 |
运行任务 | ECS集群、ECS集群服务 | 故障,危急 |
容器实例 | ECS 集群 | 故障,危急 |
EC2 待处理任务 | ECS 集群 | 故障,危急 |
EC2 运行任务 | ECS 集群 | 故障,危急 |
可用内存 | ECS 集群 | 故障,危急 |
可用的 CPU | ECS 集群 | 故障,危急 |
服务 - 待处理任务 | ECS 集群 | 故障,危急 |
服务 - 运行任务 | ECS 集群 | 故障,危急 |
文件计量大小 | EFS | 故障,危急 |
步骤失败 | 电子病历 | 故障,危急 |
调试事件数 | Elastic Beanstalk | 故障,危急 |
错误事件数 | Elastic Beanstalk | 故障,危急 |
致命事件的数量 | Elastic Beanstalk | 故障,危急 |
信息事件数 | Elastic Beanstalk | 故障,危急 |
跟踪事件数 | Elastic Beanstalk | 故障,危急 |
警告事件数 | Elastic Beanstalk | 故障,危急 |
实例降级(健康状况) | Elastic Beanstalk | 故障,危急 |
实例信息(健康) | Elastic Beanstalk | 故障,危急 |
实例无数据(健康) | Elastic Beanstalk | 故障,危急 |
实例正常(健康) | Elastic Beanstalk | 故障,危急 |
待处理的实例(健康状况) | Elastic Beanstalk | 故障,危急 |
实例严重(健康) | Elastic Beanstalk | 故障,危急 |
实例未知(健康) | Elastic Beanstalk | 故障,危急 |
实例警告(健康) | Elastic Beanstalk | 故障,危急 |