Amazon DocumentDB 监控集成
Amazon DocumentDB 是一种与 MongoDB 工作负载兼容的文档数据库服务,用于大规模管理 JSON 数据。通过 Site24x7 的集成,您可以监控 Amazon DocumentDB 集群和实例的健康状况和性能。
设置
- 请通过创建 IAM 用户或 IAM 角色为您的 AWS 账户提供 Site24x7 访问权限。了解更多。
- 在Integrate AWS Account页面上,请确保在Services to be Discovered字段中选中DocumentDB复选框。了解更多。
权限
请确保分配给为 Site24x7 创建的 IAM 用户或 IAM 角色的 IAM 策略中存在以下读取级别操作。了解更多。
- "rds:DescribeDBClusters",
- "rds:DescribeDBInstances",
- "rds:ListTagsForResource",
- "rds:DescribeCertificates",
- "rds:DescribeEvents",
- "rds:DescribeGlobalClusters",
- "logs:DescribeLogStreams",
- "logs:GetLogEvents",
- "logs:GetLogEvents",
轮询频率
根据轮询频率集(1 分钟到一天)收集汇总的 DocumentDB 指标数据。了解更多。
许可
- 每个 DocumentDB 监视器都被视为一个基本监视器。
支持的指标
DocumentDB 集群和实例指标
属性 | 描述 | 统计数据 | 单位 |
---|---|---|---|
使用的备份保留期存储 | 用于支持 Amazon DocumentDB 保留窗口内的时间点恢复功能的 GiB 备份存储总量。 | 最大 | GB,字节 |
更改flow日志大小 | 集群用于存储更改flow日志的存储量(以 MB 为单位)。 | 平均的 | MB |
CPU 利用率 | 集群使用的 CPU 百分比 | 最大 | 百分 |
数据库连接 | 以一分钟的频率在集群上打开的连接数。 | 平均值、总和、最大值 | 计数 |
最大数据库连接数 | 一分钟内集群上打开的数据库连接的最大数量。 | 平均值、总和、最大值 | 计数 |
数据库游标 | 以一分钟的频率在集群上打开的游标数。 | 平均值、总和、最大值 | 计数 |
数据库游标最大值 | 一分钟内集群上打开的最大游标数。 | 平均值、总和、最大值 | 计数 |
数据库游标超时 | 一分钟内超时的游标数。 | 和 | 计数 |
可释放内存 | 可用随机存取存储器的数量。 | 平均的 | 字节 |
可用本地存储 | 该指标报告每个实例可用于临时表和日志的存储量。 | 平均的 | MB |
低内存限制队列深度 | 由于可用内存不足而受到限制的请求的队列深度 | 和 | 计数 |
低内存限制最大队列深度 | 由于可用内存不足而受到限制的请求的最大队列深度 | 和 | 计数 |
内存不足操作受到限制 | 由于可用内存不足而受到限制的请求数 | 和 | 计数 |
使用的快照存储 | 给定 Amazon DocumentDB 集群在其备份保留窗口之外的所有快照所消耗的以 GiB 为单位的备份存储总量 | 平均的 | GB,字节 |
总备份存储计费 | 为给定的 Amazon DocumentDB 集群计费的备份存储总量(以 GiB 为单位) | 最大 | GB,字节 |
事务未结 | 实例上打开的事务数 | 平均值、总和、最大值 | 计数 |
事务开放最大值 | 实例上打开的最大事务数 | 平均值、总和、最大值 | 计数 |
使用的卷字节数 | 集群使用的存储量(以字节为单位) | 平均的 | MB |
数据库集群副本延迟最大值 | 主实例与集群中每个 Amazon DocumentDB 实例之间的最大延迟量(以毫秒为单位) | 最大 | 小姐 |
数据库集群副本延迟最小值 | 集群中主实例和每个副本实例之间的最小延迟量(以毫秒为单位)。 | 最低限度 | 小姐 |
数据库实例副本滞后 | 将更新从主实例复制到副本实例时的延迟量(以毫秒为单位)。 | 平均的 | 小姐 |
读取延迟 | 每个磁盘 I/O 操作花费的平均时间。 | 平均的 | 小姐 |
写入延迟 | 每个磁盘 I/O 操作所花费的平均时间量(以毫秒为单位)。 | 平均的 | 小姐 |
内存不足操作超时 | 由于可用内存不足而超时的操作数 | 和 | 计数 |
已删除的文件 | 已删除文档数 | 和 | 计数 |
插入的文件 | 插入文档数 | 和 | 计数 |
退回的文件 | 退回文件数 | 和 | 计数 |
文件更新 | 更新文档数 | 和 | 计数 |
操作计数器命令 | 命令数 | 和 | 计数 |
操作计数器删除 | 删除操作数 | 和 | 计数 |
操作计数器 Getmore | getmores的数量 | 和 | 计数 |
操作计数器插入 | 插入操作数 | 和 | 计数 |
操作计数器查询 | 发出的查询数 | 和 | 计数 |
操作计数器更新 | 发出的更新操作数 | 和 | 计数 |
事务开始 | 开始事务的数量 | 和 | 计数 |
已提交的事务 | 提交的事务数 | 和 | 计数 |
事务中止 | 中止的事务数 | 和 | 计数 |
TTL 删除的文件 | 删除的文件数 | 和 | 计数 |
网络接收吞吐量 | 集群中每个实例从客户端接收的网络吞吐量(以每秒字节数为单位) | 平均的 | mb/秒 |
网络吞吐量 | Amazon DocumentDB 集群中的每个实例从客户端接收和传输到客户端的网络吞吐量(以每秒字节数为单位)。 | 平均的 | mb/秒 |
网络传输吞吐量 | 集群中每个实例向客户端发送的网络吞吐量(以每秒字节数为单位)。 | 平均的 | mb/秒 |
读取 IOPS | 每秒平均磁盘读取 I/O 操作数。 | 平均的 | 计数 |
写 IOPS | 每秒平均磁盘写入 I/O 操作数。 | 平均的 | 计数 |
读取吞吐量 | 每秒从磁盘读取的平均字节数。 | 平均的 | 字节/秒 |
写入吞吐量 | 每秒写入磁盘的平均字节数。 | 平均的 | 字节/秒 |
卷读取 IOP | 来自集群卷的平均计费读取 I/O 操作数 | 平均的 | 计数 |
卷写入 IOP | 来自集群卷的平均计费写入 I/O 操作数 | 平均的 | 计数 |
缓冲区缓存命中率 | 缓冲区高速缓存服务的请求百分比。 | 平均的 | 百分 |
磁盘队列深度 | 对分布式存储卷的并发写入请求数。 | 和 | 计数 |
发动机正常运行时间 | 实例已运行的时间量(以秒为单位)。 | 平均的 | 秒 |
索引缓冲区缓存命中率 | 缓冲区高速缓存服务的索引请求的百分比。 | 平均的 | 百分 |
CPU 额度使用情况 | 在监测期间花费的 CPU 额度。 | 平均的 | 计数 |
CPU 额度余额 | 实例累积的 CPU 额度。 | 平均的 | 计数 |
CPU 剩余配额 | 当 CPUCreditBalance 值为零时,用于维持 CPU 性能的剩余 CPU 额度。 | 平均的 | 计数 |
收取的 CPU 剩余额度 | 超过 24 小时内可获得的最大 CPU 额度的剩余 CPU 额度,因此会产生额外费用。 | 平均的 | 计数 |
交换使用 | 实例上使用的交换空间量。 | 平均的 | 字节 |
DocumentDB 全局集群指标
属性 | 描述 | 统计数据 | 单位 |
---|---|---|---|
全局集群复制写入 IO | 从主要 AWS 区域中的集群卷复制到辅助 AWS 区域中的集群卷的计费写入 I/O 操作的平均数量 | 平均的 | 计数 |
GlobalClusterDataTransferBytes | 从主集群的 AWS 区域传输到辅助集群的 AWS 区域的数据量 | 平均的 | MB |
GlobalClusterReplicationLag | 将更改事件从主集群的 AWS 区域复制到辅助集群的 AWS 区域时的延迟量(以毫秒为单位) | 平均的 | ms |
查看数据
- 登录到 Site24x7 控制台。单击 AWS。选择监控的 AWS 账户。
- 从下拉菜单中选择DocumentDB 。
- 从监控的资源列表中,选择要查看其指标的 DocumentDB 资源。
阈值配置
为与 DocumentDB 相关的各种性能指标设置阈值,并在超出配置值时收到告警。
- 转到管理>配置文件>阈值和可用性> (+)。您还可以通过Cloud> AWS> 单击 AWS 帐户 > DocumentDB Cluster/ DocumentDB Instance/ DocumentDB Global Clusters> 将鼠标悬停在显示名称旁边的三横杠图标上 >编辑>阈值和可用性> 单击铅笔图标。
- 在Add Threshold and Availability 表单中,选择DocumentDB Cluster、DocumentDB Global Clusters或 DocumentDB Instance。
- 为所需指标设置阈值。
- 保存您的更改。
Site24x7 的 DocumentDB 监控界面
概括
本节为您提供操作细节,如 CPU 利用率、数据库连接、数据库连接最大值、数据库游标、数据库游标最大值、可用内存、缓冲区缓存命中率、由于内存不足而超时的操作数、快照和备份存储等更多指标。
配置详情
获取详细信息,包括集群 ID、状态、可用区、区域、备份保留期、引擎名称及其版本、主用户名、端口、子网组详细信息和其他配置详细信息。
监控的资源
此处提供了各种资源可用性状态,以及有关相关 DocumentDB 集群和实例、资源名称、类型、显示名称、状态和操作的信息。操作列允许您设置告警并在被监控资源标记为关闭、危急或故障时添加自动化。
审核日志和探查器日志
查看审计事件和探查器事件以监控集群上执行的操作的执行时间和详细信息。这些日志证明有助于识别集群上的慢速操作并提高单个查询性能和整体集群性能。
集群事件
查看与您的集群、实例、快照、安全组和集群参数组相关的事件。获取详细信息,包括事件的日期和时间、事件的源名称和源类型,以及与事件关联的消息。此选项卡仅适用于 DocumentDB Cluster 和 DocumentDB Instance 监视器。
中断
资源的各种状态(如停机、故障、严重或维护)的历史记录显示在“中断”选项卡中。本节提供了有关中断的开始时间和结束时间、持续时间和评论(如果有)的详细信息。您还可以编辑或删除评论。
日志报表
在这里,您可以查看 DocumentDB 集群和 DocumentDB 实例的审核日志数据,以及时间戳、状态、CPU 利用率、数据库连接总数和数据库游标总数的详细信息。