重启 ElastiCache 集群
使用 Site24x7 的 IT 自动化框架,您可以创建一个动作配置文件,以自动重新启动和刷新监控的 Redis 和 Memcached 兼容缓存节点/集群上的所有密钥。您可以选择重新启动集群中的部分或全部缓存节点,也可以选择重新启动整个集群本身。
所需权限
请确保 Site24x7 承担的 IAM 角色或为 Site24x7 创建的 IAM 用户在附加的策略文档中具有以下部分写入操作以执行这些操作。
- elasticache:RebootCacheCluster
约束
- 仅 Memcached 缓存引擎类型支持重新启动缓存集群。
- 要执行该操作,缓存节点/集群需要处于运行状态并且需要被 Site24x7 监控。
创建动作配置文件
- 登录到 Site24x7 Web 控制台,选择管理> IT 自动化模板
- 单击下拉菜单并选择要执行的操作(即 Memcached 引擎类型的集群和节点级别重启和 Redis 引擎类型的节点级别重启)
- 提供适当的显示名称以进行识别
- 要执行的操作将预先填充在下面的字段中
- 接下来,单击下拉列表以选择需要重新启动的缓存节点/集群列表(您可以选择选项 $LOCALHOST 以在所有映射的缓存集群/节点上执行操作)
- 最大允许动作执行时间:Site24x7 在请求超时之前必须等待的最大秒数。默认情况下,执行时间设置为 15 秒。您可以定义1-90 秒之间的执行时间 。
- 通过电子邮件发送自动化结果:您可以通过切换到是来选择接收有关自动化结果的电子邮件。通过电子邮件将自动化结果共享给在通知配置文件中配置的用户告警组。此电子邮件将包含参数,包括自动化名称、自动化类型、事件原因、目标主机等。
- 保存配置文件
模拟自动化
在映射动作配置文件之前,您可以通过在 Site24x7 控制台中手动调用操作任务或使用我们的 REST API 来测试其功能。这样做是为了检查是否需要适当的写入级别权限来执行重新启动操作。要进行测试,请导航回 IT 自动化摘要页面并单击 以执行试运行。
映射动作配置文件
要执行自动化,请将动作配置文件映射到所需的告警事件。您可以将配置文件映射到预定义的监视器级别事件类型或自定义属性级别事件类型。
监视器级别映射
导航到监控的 ElastiCache 节点/集群的编辑监控页面,并将动作配置文件映射到以下任何监视器状态更改。
- 停机执行
- 正常执行
- 遇到问题执行
- 执行任何状态更改
属性级映射
您还可以将动作配置文件与任何监控的 AWS 资源或应用程序相关的指标数据点相关联,例如 CPU 使用率、连接、读写 IOPS 等。导航到监控的 AWS 资源或应用程序服务的编辑阈值配置文件页面(导航到资源的编辑监视器页面 > 单击阈值和可用性字段旁边的铅笔图标)并通过单击将配置文件映射到任何所需的属性“选择要执行的自动化”字段。