AWS 运行状况监控集成
AWS 健康状况 为您提供有关 AWS 资源、服务和账户状态的实时信息。该服务会通知您可能会影响您的 AWS 资源的资源性能或可用性问题,并提供补救建议。AWS 运行状况监视器会在 AWS 资源的运行状况发生变化(包括计划的维护事件或意外中断)时提供告警。这为您提供了更好的可见性和指导来解决任何问题。
目录
用例
- AWS 健康状况 代表其他 AWS 服务创建事件。这些事件会通知您即将发生的或预定的可能会影响您的帐户的更改。例如,如果 AWS Identity and Access Management (IAM) 计划弃用托管策略或 AWS Configuration 计划弃用托管规则,AWS 健康状况 可以创建事件。在这种情况下,如果您的帐户与 Site24x7 集成,那么您将收到该特定事件的通知告警。这将帮助您根据事件采取必要的行动。
- 当 AWS 区域中存在服务可用性问题时,AWS 健康状况 还会创建事件。如果您的帐户与 Site24x7 集成,您将收到事件通知告警。您可以查看事件描述以了解问题、识别任何受影响的资源并采取任何建议的操作,以免您的 AWS 资源受到影响。
Site24x7 与 AWS 健康状况 集成的优势
Site24x7 与 AWS 健康状况 的集成为您提供了一个统一的平台来查看和识别影响您的 AWS 资源的事件和问题。
通过 Site24x7 和 AWS 健康状况 之间的集成,您可以:
- 获得有关您的 AWS 服务和账户的清晰见解。
- 跟踪您的资源可用性并根据区域、服务和事件类型等类别查看健康事件的数量。
- 分析运行状况事件如何影响您的 AWS 资源并对其进行管理。
- 使用高级设置配置健康事件通知。
- 为受影响的资源配置阈值并接收告警。
设置和配置
- 如果您还没有这样做,请通过在您的账户和 Site24x7 的 AWS 账户之间创建跨账户 IAM 角色来启用对 AWS 资源的访问。了解更多。
- 在集成AWS 账户页面上,请确保在待发现服务字段中选择AWS 健康状况 。了解更多。
策略和权限
确保 Site24x7 需要以下权限来监控您的 AWS 资源的运行状况:
- "health:DescribeAffectedEntities"
- "health:DescribeEventAggregates"
- "health:DescribeEventDetails"
- "health:DescribeEvents"
- AWS Account with Business, Enterprise On-Ramp, or Enterprise Support plan
轮询频率
AWS 运行状况监控的指标数据以五分钟的默认轮询频率收集。
支持的 AWS 运行状况指标
以下指标适用于区域、服务和事件类型级别。指标可用性也基于事件类别。例如,问题事件监视器将没有即将到来的事件指标。
指标名称 | 描述 | 单元 |
事件开放 | 处于打开状态的运行状况事件数 | 计数 |
即将举行的事件 | 状态为即将到来的健康事件的数量 | 计数 |
事件结束 | 状态为已关闭的运行状况事件数 | 计数 |
事件总数 | 捕获的事件总数 | 计数 |
阈值配置
转到管理>配置文件>阈值和可用性 (+),然后选择AWS 健康状况作为监控类型。您可以为上述所有指标设置阈值,并通过切换“通知公共事件 ”和“通知帐户事件”选项来配置接收通知。
查看 AWS 运行状况
要查看您的 AWS 资源的运行状况,请登录您的 Site24x7 账户并导航到Cloud > AWS > AWS 健康状况。
Site24x7 与 AWS 健康状况 的集成提供了以下三个监视器来查看和识别影响您的 AWS 资源的事件和问题:
- 账户通知:监控所有帐户通知健康事件,例如证书轮换、计费通知和安全漏洞。
- 问题:所有具有问题类别的健康事件都由问题监视器监控。此类别中的常见事件包括有关导致服务降级的操作问题或您需要了解的本地资源级别问题的通信。
- 计划变更:计划变更监视计划变更类别下的所有运行状况事件。这些事件提供有关您的服务和资源即将发生的更改的信息。
AWS 健康数据
您可以在以下选项卡中查看 AWS 资源的运行状况数据:
概括
摘要选项卡提供基于事件状态的事件图表概览。从这里,您可以查看Event Types、Events Open、Events Upcoming和Total Events Occurred。例如,假设您的一个 AWS 资源中发生了健康事件问题。事件打开计数将在问题监视器上更新为最新计数,以便您了解更改。
正在进行的事件
正在进行选项卡显示当前事件,包括可能影响您的 AWS 资源的未决事件和即将发生的事件。
监控的受影响资源
监控的受影响资源选项卡显示所有受监控的资源,这些资源也是受影响的资源。例如,如果 EC2 实例监控器受到同样在 Site24x7 下监控的运行状况事件的影响,则 EC2 实例监控器将列在受监控的受影响资源选项卡下。
地区
区域选项卡提供了发生事件的 AWS 资源区域的详细信息。
服务
服务选项卡显示受事件影响的 AWS 服务的详细信息。
事件历史
事件历史选项卡显示过去发生的所有事件的历史。