Amazon Elastic Container Service 监控集成

Amazon Elastic Container Service 让您可以轻松地在 EC2 实例的托管集群上运行 Dockerized 应用程序。通过 Site24x7 的集成,您现在可以监控 EC2 启动类型和 Fargate 启动类型的集群级别和服务级别的利用率统计信息。

先决条件

  • 对于 EC2 启动类型,请确保 Amazon ECS 容器实例正在运行容器代理版本 1.4.0 或更高版本。此外,确保在启动期间分配给容器实例的 IAM 角色具有 ecs:StartTelemetrySession 权限。
  • 对于 Fargate 启动类型,会自动收集 CloudWatch CPU 和内存利用率指标。

设置

  • 如果您尚未这样做,请通过创建 IAM 用户或 IAM 角色来提供对您的 AWS 账户的 Site24x7 访问权限。了解更多
  • 在 Integrate AWS Account 页面上,请确保在 Services to be found 字段中选中 ECS Cluster 复选框。了解更多

权限

请确保分配给为 Site24x7 创建的 IAM 用户或 IAM 角色的 IAM 策略中存在以下读取级别操作。了解更多

  • "ecs:ListServices",
  • "ecs:ListAccountSettings",
  • "ecs:ListTagsForResource",
  • "ecs:DescribeServices",
  • "ecs:ListContainerInstances",
  • "ecs:DescribeContainerInstances",
  • "ecs:DescribeClusters",
  • "ecs:ListClusters",
  • "ecs:ListTasks",
  • "ecs:DescribeTasks"

轮询频率

根据轮询频率集(1 分钟到一天)收集汇总的 ECS 指标数据。了解更多

许可

  • 每个 ECS 集群都被视为一个基本监视器。
  • 在您的集群中运行的每个 ECS 服务都被视为一个基本监视器。

支持的指标

集群

跨集群收集以下指标:

属性 描述 统计数据 数据类型
CPU 预留 监测集群中运行任务预留的 CPU 单元百分比。 平均的 百分
集群 CPU 利用率 监测集群中使用的 CPU 单元的百分比。 平均的 百分
内存预留 监测集群中为运行任务保留的内存百分比。 平均的 百分
集群内存利用率 监测集群中使用的内存百分比。 平均的 百分
主动服务 监测集群中运行的活动服务的数量。  计数
待处理任务 监测处于 PENDING 状态的任务数。  和  计数
运行任务 监测处于 RUNNING 状态的任务数。 和  计数
容器实例 监测注册到集群的容器实例的数量。 和  计数

服务

在服务级别上收集以下指标:

属性 描述 统计数据 数据类型
服务 CPU 利用率 监测服务中使用的 CPU 单元的百分比 平均的 百分
服务内存利用率 监测服务中使用的内存百分比。 平均的 百分
待处理的任务 监测服务中处于 PENDING 状态的任务数。 计数
运行任务 监测服务中处于 RUNNING 状态的任务数。 计数

容器实例 

属性 描述 统计数据 数据类型
EC2 待处理任务 监测每个容器实例处于 PENDING 状态的任务数。 计数
EC2 运行任务 监测每个容器实例的 RUNNING 任务中的任务数。 计数
可用的 CPU 监测每个容器实例可用的 CPU 单元数。 平均的 单位
可用内存 监测容器实例上剩余的内存单元数。 平均的 小米B

容器insight

属性 描述 统计数据 数据类型
CPU 使用率 集群中的任务使用的 CPU 单元。 平均的 百分比
CPU 保留 集群中任务预留的 CPU 单元。 平均的 单位
内存使用 集群中的任务使用的内存。 平均的 百分比
内存保留 集群中任务预留的内存。 平均的 MB
网络接收字节 集群中资源接收的字节数。 MB
网络传输字节 集群中资源传输的字节数。 MB
存储读取字节 从集群中的存储读取的字节数。 MB
存储写入字节 写入集群中存储的字节数。 MB
容器实例计数 在已注册到集群的 Amazon ECS 代理上运行的 EC2 实例的数量。 最大 计数
部署计数 集群中的部署数量。 最大 计数
所需任务计数 集群中所需的任务数。 最大 计数
待处理任务计数 当前处于 PENDING 状态的任务数。 最大 计数
运行任务计数 当前处于 RUNNING 状态的任务数。 最大 计数
任务集计数 服务中的任务集数量。 最大 计数

任务

属性 描述
任务失败 报告任务是否因错误而停止或无法启动。


查看数据

  • 登录到 Site24x7 控制台。单击AWS。选择监控的 AWS 账户。
  • 从下拉菜单中选择ECS 集群(或)ECS 集群服务
  • 从监控的集群或服务列表中,选择您要查看其指标的 ECS 资源。

元数据

此任务详细信息提供有关任务状态和配置的以下信息。

属性 描述
任务编号 任务的唯一 ID。 
任务定义 完整的任务定义描述。 
集群名称 集群的简称。
发射类型 运行任务的启动类型。有效值为 EC2 和 Fargate。
期望状态 显示任务的所需状态。
最后状态 显示任务的最后已知状态。
CPU 显示任务使用的 CPU 单元数。 
内存 显示任务使用的内存量。 
开始于 显示任务启动时指定的标签。 
版本 任务的版本计数器。
创建于 显示创建任务时的时间戳。 
停在 显示任务停止时的时间戳。 
任务持续时间 显示任务创建时间和任务停止时间之间的时间差。
停止原因 显示任务从 RUNNING 转换的时间间隔 
连接性 显示任务的连接状态。 
连接在 显示任务进入 CONNECTED 状态的时间戳。 
执行停止于 显示执行停止时的时间戳。 
团体 与您的任务关联的任务组的名称。 
平台版本 运行任务的平台版本。