如果是Linux服务器监控,您可能需要去熟悉术语平均负载/系统负载。衡量平均负载对于了解服务器的性能至关重要;如果运行过载,您需要终止或优化消耗大量资源的进程,或者提供更多资源来平衡工作负载。 但是如何确定您的服务器是否有足够的负载能力?让我们深入了解一下。
平均负载是 Linux 服务器上指定时间段内的平均系统负载。换句话说,它是服务器的CPU所需,包括运行和等待线程的总和。 通常,top 或 uptime 命令将提供服务器的平均负载,输出如下所示: 这些数字是1分钟、5分钟和 15 分钟内系统负载的平均值。 在讨论如何衡量负载平均输出以及每个值的含义之前,让我们先看一个最简单的示例:包含单核处理器的服务器。
带有单核处理器的服务器就像是一排顾客在杂货店等待他们的商品结帐。在高峰时段,通常会排很长的队,每个人的等待时间也很长。 如果您是收银员并想记录等待时间,一个重要的指标是特定时间段内等待的人数。如果没有顾客等待,则等待时间为零。另一方面,如果顾客排长队,则等待时间很长。
将其应用于我们上面得到的平均负载输出 (0.5, 1.5, 3.0): ~~0.5 表示在柜台的最短等待时间。0.00到1.0之间,不用担心。您的服务器是安全的! ~~1.5 表示队列已满。如果平均值变得更高,性能就会降低。 ~~3.00 意味着有相当长的队列等待,并且需要额外的资源/计数器来更快地清理队列。 您想要的是介于 0.00 和 1.00 之间的队列/负载平均值。那么我们是否可以得出理想的平均负载为 1.00 的结论,而高于此值的任何内容都需要采取行动进行故障排除?好吧,虽然这是一个方法,但更积极的方法是留出一些额外的空间来管理意外增加的负载。
多核和多处理器助您一臂之力
单个四核处理器和具有四个处理器(每个处理器一个核)的服务器是否相同?相对来说,是的。多核和多处理器的主要区别在于,前者是指单个 CPU 具有多个内核,而后者是指多个 CPU。总结一下:一个四核等于两个双核,也就是四个单核。
平均负载与服务器中可用内核的数量有关,而不是它们在 CPU 上的分布情况。这意味着最大利用率范围是单核 0-1、双核 0-2、四核 0-4、八核 0-8,依此类推。
再次参考收银员的示例,负载为 1.00 意味着容量在单核处理器上恰到好处;而在双核处理器上,负载为 1.50 意味着负载已满,另一个也要耗尽满。同样,四核处理器上的 5.00 负载是值得担心的,而在八核处理器上,5.00 意味着正在消耗,并且仍有最佳可用空间。
Site24x7的作用:监控平均负载
为更高的负载值添加资源可能会增加您的基础架构成本。有效管理负载并保持最佳水平以避免服务器性能下降问题是理想的。Site24x7 Linux 监控监控 60 多个性能指标中的负载平均值,并以直观且易于理解的图表提供 1、5 和 15 分钟的平均值。
此外,您可以设置阈值并在发生违规时收到通知。但是,如果在半夜出现漏洞怎么办?Site24x7 也有一个解决方案。监控工具提供了一组用于自动故障解决的 IT 自动化。
例如,如果双核处理器的系统负载阈值设置为 2.90,您可以上传服务器脚本或添加服务器命令以在超出阈值时自动执行纠正措施。这样,无需任何人工干预,即可解决问题并大大缩短平均修复时间 (MTTR)。
添加更多内核可能会提高您的服务器性能,但也可能会增加您的基础设施支出。持续监控负载平均值以保持对现有设置的有效管理是一种理想的选择。Site24x7 Server 监控不仅监视平均负载,而且还提供补充故障解决工具以在高平均负载影响服务器性能之前采取行动。立即注册 30 天免费试用!