帮助手册 Amazon Web Services Amazon Neptune Cluster

Amazon Neptune 集群监控集成

Amazon Neptune 是一种完全托管的图形数据库服务,用于构建和运行使用高度连接的数据集的应用程序。一个 Amazon Neptune 集群包含一个或多个 Neptune 实例。

设置和配置

1. 如果您还没有,请通过以下任一方式在您的 AWS 账户和 Site24x7 的 AWS 账户之间启用对 AWS 资源的访问:

  • 以 IAM 用户身份创建 Site24x7
  • 创建跨账户 IAM 角色。了解更多

2. 在集成 AWS 账户页面上,选中 Amazon Neptune 集群旁边的框。了解更多

策略和权限

Site24x7 需要以下权限才能发现 Amazon Neptune 并收集配置信息。了解更多

  • "rds:DescribeDBInstances",
  • "rds:ListTagsForResource",
  • "rds:DescribeDBClusters",
  • "rds:DescribeEvents",
  • "logs:DescribeLogStreams",
  • "logs:GetLogEvents",
  • "rds:DescribeDBClusterParameterGroups"

轮询频率

Site24x7 根据配置的轮询频率查询 AWS 以收集 Neptune 集群性能指标。支持的最小轮询间隔为一分钟,最长为 24 小时。了解更多

支持的指标

属性 描述 统计 数据类型
集群 ReplicaLag 最大值 主实例与数据库集群中每个 Neptune 数据库实例之间的最大滞后量 最大 毫秒
集群 ReplicaLag 最小值 主实例与数据库集群中每个 Neptune 数据库实例之间的最小滞后量 最低限度 毫秒
引擎启动时间 实例已运行的时间量 最大
可释放内存 可用的随机存取内存量 最低限度 MB
可用本地存储 可用于临时表和日志的存储量 最低限度 MB
Gremlin 错误 Gremlin 遍历中的错误数 计数
Gremlin请求 Gremlin 引擎的请求数 计数
Gremlin 每秒请求数 每秒对 Gremlin 引擎的请求数 计数/秒
Gremlin WebSocket 可用连接 当前可用的潜在 WebSocket 连接数 计数/秒
Gremlin WebSocket 客户端错误 每秒 Gremlin 端点上的 WebSocket 客户端错误数 计数/秒
Gremlin WebSocket 服务器错误 每秒 Gremlin 端点上的 WebSocket 服务器错误数 计数/秒
Gremlin WebSocket 成功 每秒到 Gremlin 端点的成功 WebSocket 连接数 计数/秒
加载程序错误 来自 Loader 请求的错误数 计数
加载程序请求 加载器请求数 计数
网络接收吞吐量 数据库实例上的传入网络流量,包括用于监控和复制的客户数据库流量和 Neptune 流量 平均的 MB/秒
网络吞吐量 Neptune 数据库集群中每个实例从客户端接收和传输到客户端的网络吞吐量 平均的 MB/秒
网络传输吞吐量 数据库实例上的传出网络流量,包括用于监控和复制的客户数据库流量和 Neptune 流量 平均的 MB/秒
SPARQL 错误 SPARQL 查询中的错误数 计数
SPARQL 请求 对 SPARQL 引擎的请求数 计数
每秒 SPARQL 请求数 每秒对 SPARQL 引擎的请求数 计数/秒
状态错误 来自状态端点的错误数 计数
状态请求 对状态端点的请求数 计数
Http1xx 每秒端点的 HTTP 1xx 错误数 计数/秒
Http2xx 每秒端点的 HTTP 2xx 错误数 计数/秒
Http4xx 每秒端点的 HTTP 4xx 错误数 计数/秒
Http5xx 每秒端点的 HTTP 5xx 错误数 计数/秒
Gremlin Http1xx Gremlin 端点每秒的 HTTP 1xx 错误数 计数/秒
Gremlin Http2xx Gremlin 端点每秒的 HTTP 2xx 错误数 计数/秒
Gremlin Http4xx Gremlin 端点每秒的 HTTP 4xx 错误数 计数/秒
Gremlin Http5xx Gremlin 端点每秒的 HTTP 5xx 错误数 计数/秒
Sparql Http1xx SPARQL 端点每秒的 HTTP 1xx 错误数 计数/秒
Sparql Http2xx SPARQL 端点每秒的 HTTP 2xx 错误数 计数/秒
Sparql Http4xx SPARQL 端点每秒的 HTTP 4xx 错误数 计数/秒
Sparql Http5xx SPARQL 端点每秒的 HTTP 5xx 错误数 计数/秒
使用的备份保留期存储 监测用于支持备份保留窗口内的时间点恢复功能的计费备份存储量。 最大 MB
集群副本滞后 对于只读副本,从主实例复制更新时的滞后量。 平均的 毫秒
总备份存储计费 计费的备份存储总量。 最大 MB
卷读 I OP 来自集群卷的计费读取 I/O 操作的平均数量。 计数
卷写入 I OP 对集群卷的平均写入磁盘 I/O 操作数。 计数
使用的卷字节数 您的 Neptune 数据库实例使用的存储量。 MB

Site24x7 的 Amazon Neptune 集群监控选项卡

概括

通过时间序列图表了解每个集群中发生的不同进程,这些图表提供有关 Gremlin 请求、Gremlin 错误、网络吞吐量、SPARQL 错误和 SPARQL 请求的事件时间线。

Neptune实例

如果您使用 Site24x7 监控您的 Neptune 实例,这些服务的状态将在Neptune Instances选项卡中列出。您可以单击任何服务以查看其详细指标。 您还可以通过单击“ 操作” 下 的铅笔图标来设置阈值并在这些服务中的任何一个失败时收到通知

配置详情

此选项卡下提供了集群的配置详细信息。您可以在此处找到的详细信息包括集群状态、集群 ARN、端点 URL、引擎版本、分配的存储空间等。

活动

事件选项卡包含与过去的数据库实例、数据库安全组、数据库快照和数据库参数组相关的事件的信息。

最近的日志

在这里,您可以查看 CloudWatch 日志已发布的 Neptune 数据库集群的审核日志数据。

帮助手册 Amazon Web Services Amazon Neptune Cluster