Amazon Neptune 集群监控集成
Amazon Neptune 是一种完全托管的图形数据库服务,用于构建和运行使用高度连接的数据集的应用程序。一个 Amazon Neptune 集群包含一个或多个 Neptune 实例。
设置和配置
1. 如果您还没有,请通过以下任一方式在您的 AWS 账户和 Site24x7 的 AWS 账户之间启用对 AWS 资源的访问:
- 以 IAM 用户身份创建 Site24x7
- 创建跨账户 IAM 角色。了解更多
2. 在集成 AWS 账户页面上,选中 Amazon Neptune 集群旁边的框。了解更多
策略和权限
Site24x7 需要以下权限才能发现 Amazon Neptune 并收集配置信息。了解更多
- "rds:DescribeDBInstances",
- "rds:ListTagsForResource",
- "rds:DescribeDBClusters",
- "rds:DescribeEvents",
- "logs:DescribeLogStreams",
- "logs:GetLogEvents",
- "rds:DescribeDBClusterParameterGroups"
轮询频率
Site24x7 根据配置的轮询频率查询 AWS 以收集 Neptune 集群性能指标。支持的最小轮询间隔为一分钟,最长为 24 小时。了解更多
支持的指标
属性 | 描述 | 统计 | 数据类型 |
---|---|---|---|
集群 ReplicaLag 最大值 | 主实例与数据库集群中每个 Neptune 数据库实例之间的最大滞后量 | 最大 | 毫秒 |
集群 ReplicaLag 最小值 | 主实例与数据库集群中每个 Neptune 数据库实例之间的最小滞后量 | 最低限度 | 毫秒 |
引擎启动时间 | 实例已运行的时间量 | 最大 | 秒 |
可释放内存 | 可用的随机存取内存量 | 最低限度 | MB |
可用本地存储 | 可用于临时表和日志的存储量 | 最低限度 | MB |
Gremlin 错误 | Gremlin 遍历中的错误数 | 和 | 计数 |
Gremlin请求 | Gremlin 引擎的请求数 | 和 | 计数 |
Gremlin 每秒请求数 | 每秒对 Gremlin 引擎的请求数 | 和 | 计数/秒 |
Gremlin WebSocket 可用连接 | 当前可用的潜在 WebSocket 连接数 | 和 | 计数/秒 |
Gremlin WebSocket 客户端错误 | 每秒 Gremlin 端点上的 WebSocket 客户端错误数 | 和 | 计数/秒 |
Gremlin WebSocket 服务器错误 | 每秒 Gremlin 端点上的 WebSocket 服务器错误数 | 和 | 计数/秒 |
Gremlin WebSocket 成功 | 每秒到 Gremlin 端点的成功 WebSocket 连接数 | 和 | 计数/秒 |
加载程序错误 | 来自 Loader 请求的错误数 | 和 | 计数 |
加载程序请求 | 加载器请求数 | 和 | 计数 |
网络接收吞吐量 | 数据库实例上的传入网络流量,包括用于监控和复制的客户数据库流量和 Neptune 流量 | 平均的 | MB/秒 |
网络吞吐量 | Neptune 数据库集群中每个实例从客户端接收和传输到客户端的网络吞吐量 | 平均的 | MB/秒 |
网络传输吞吐量 | 数据库实例上的传出网络流量,包括用于监控和复制的客户数据库流量和 Neptune 流量 | 平均的 | MB/秒 |
SPARQL 错误 | SPARQL 查询中的错误数 | 和 | 计数 |
SPARQL 请求 | 对 SPARQL 引擎的请求数 | 和 | 计数 |
每秒 SPARQL 请求数 | 每秒对 SPARQL 引擎的请求数 | 和 | 计数/秒 |
状态错误 | 来自状态端点的错误数 | 和 | 计数 |
状态请求 | 对状态端点的请求数 | 和 | 计数 |
Http1xx | 每秒端点的 HTTP 1xx 错误数 | 和 | 计数/秒 |
Http2xx | 每秒端点的 HTTP 2xx 错误数 | 和 | 计数/秒 |
Http4xx | 每秒端点的 HTTP 4xx 错误数 | 和 | 计数/秒 |
Http5xx | 每秒端点的 HTTP 5xx 错误数 | 和 | 计数/秒 |
Gremlin Http1xx | Gremlin 端点每秒的 HTTP 1xx 错误数 | 和 | 计数/秒 |
Gremlin Http2xx | Gremlin 端点每秒的 HTTP 2xx 错误数 | 和 | 计数/秒 |
Gremlin Http4xx | Gremlin 端点每秒的 HTTP 4xx 错误数 | 和 | 计数/秒 |
Gremlin Http5xx | Gremlin 端点每秒的 HTTP 5xx 错误数 | 和 | 计数/秒 |
Sparql Http1xx | SPARQL 端点每秒的 HTTP 1xx 错误数 | 和 | 计数/秒 |
Sparql Http2xx | SPARQL 端点每秒的 HTTP 2xx 错误数 | 和 | 计数/秒 |
Sparql Http4xx | SPARQL 端点每秒的 HTTP 4xx 错误数 | 和 | 计数/秒 |
Sparql Http5xx | SPARQL 端点每秒的 HTTP 5xx 错误数 | 和 | 计数/秒 |
使用的备份保留期存储 | 监测用于支持备份保留窗口内的时间点恢复功能的计费备份存储量。 | 最大 | MB |
集群副本滞后 | 对于只读副本,从主实例复制更新时的滞后量。 | 平均的 | 毫秒 |
总备份存储计费 | 计费的备份存储总量。 | 最大 | MB |
卷读 I OP | 来自集群卷的计费读取 I/O 操作的平均数量。 | 和 | 计数 |
卷写入 I OP | 对集群卷的平均写入磁盘 I/O 操作数。 | 和 | 计数 |
使用的卷字节数 | 您的 Neptune 数据库实例使用的存储量。 | 和 | MB |
Site24x7 的 Amazon Neptune 集群监控选项卡
概括
通过时间序列图表了解每个集群中发生的不同进程,这些图表提供有关 Gremlin 请求、Gremlin 错误、网络吞吐量、SPARQL 错误和 SPARQL 请求的事件时间线。
Neptune实例
如果您使用 Site24x7 监控您的 Neptune 实例,这些服务的状态将在Neptune Instances选项卡中列出。您可以单击任何服务以查看其详细指标。 您还可以通过单击“ 操作” 下 的铅笔图标来设置阈值并在这些服务中的任何一个失败时收到通知。
配置详情
此选项卡下提供了集群的配置详细信息。您可以在此处找到的详细信息包括集群状态、集群 ARN、端点 URL、引擎版本、分配的存储空间等。
活动
事件选项卡包含与过去的数据库实例、数据库安全组、数据库快照和数据库参数组相关的事件的信息。
最近的日志
在这里,您可以查看 CloudWatch 日志已发布的 Neptune 数据库集群的审核日志数据。