监控AWS Elastic Load Balancer指标。
分析ELB请求计数。
跟踪Elastic Load Balancer接收和路由的客户端请求数。监控平均请求率可以让您了解应用程序的流量需求。分析趋势将告诉您是否必须添加实例或启用Auto Scaling。
确定延迟模式。
延迟或目标响应时间度量标准将为您提供后端实例响应应用程序请求所花费的时间的帐户。分析EC2实例或容器的资源利用率,以将延迟峰值与CPU或内存使用量增加相关联。
避免请求溢出。
增加延迟和系统资源限制可能导致请求排队等待。跟踪使用浪涌队列长度指标排队的平均请求数。配置阈值和告警以保持浪涌队列长度增加,以防止请求溢出。
Site24x7支持对其他AWS服务进行深度基础架构监控
对ELB HTTP错误响应代码进行故障排除。
收集有关Elastic Load Balancer返回的HTTP错误响应代码数量的统计信息。这些错误代码可以是客户端相关(4XX错误)或后端实例相关(5XX)。通过分析返回的错误代码类型来确定潜在原因。
监视目标HTTP错误响应代码。
获取组中目标生成的HTTP 4XX和5XX错误代码的汇总。监控和设置告警可以让您知道后端服务器何时生成这些错误。查看应用程序日志,查看相应的时间以解决问题。
修复后端连接错误。
测量负载均衡器与其已注册实例之间无法成功建立的连接数。深入了解以确定特定EC2实例或可用区是否是问题的根源。
通过免费试用开始监控您的AWS环境。
跟踪健康和不健康的宿主数量。
从长远来看,减少数量的已注册健康主机可能会增加延迟。监控每个可用区域中健康和不健康主机的平均数量,设置告警触发器以确保足够的健康实例始终位于负载均衡器后面,以便为传入请求提供服务。
检查连接计数统计。
了解应用程序类型Elastic Load Balancer的前端和后端连接统计信息。跟踪在客户端,ELB和目标之间建立的新的和活动的TCP连接的数量。了解ELB系统的可扩展性,知道负载均衡器在开始拒绝它们之前可以处理多少活动并发TCP套接字连接。