Site24x7 服务器监控(基于代理)
使用我们轻量级、易于安装的代理监控您的服务器。通过 60 多个性能指标、直观的仪表板、RCA、IT 自动化和即时告警机制,领先于中断和性能下降问题。
代理架构 - 美国数据中心
在 Site24x7 中,两个数据中心——主数据中心(PDC) 和灾难恢复数据中心 (DRDC) 设置在不同的位置,以确保在数据中心发生故障时监控服务不中断。
- 主数据中心 (PDC) - plus.site24x7.com
- 灾难恢复数据中心 (DRDC) - 主要 (plus2.site24x7.com) 和辅助 (plus3.site24x7.com)
如果 PDC 出现任何错误,通过心跳检查的状态信息会自动发送到 Primary DRDC,从而避免由于间歇性网络故障而导致的错误告警。如果 Primary DRDC 发生错误,Secondary DRDC 仍将接收心跳检查以确保继续监控。正常情况下的服务器关闭由代理清楚地传达给我们的数据中心。此外,确保将必要的域、端口和 IP 地址列入白名单 ,以允许在防火墙中进行访问。
一旦代理成功安装在用户机器中,它与 PDC 的通信将使用单向 HTTPS 连接启动。代理通信通过三种主要方式进行:
- 每分钟执行的心跳检查
- 以一分钟和五分钟的轮询频率收集数据。了解如何批量更改此设置或为单个监视器更改此设置
- 通过每 30 秒发生一次 的设备消息系统(DMS)进行实时通信
这是代理每分钟对 PDC 进行的状态信息检查。服务器的正常运行时间取决于 Site24x7 从服务器上运行的代理收到心跳检查后的时间。如果代理无法与 PDC 通信,它将尝试联系主要 DRDC,然后联系辅助 DRDC。
如果连续七分钟的时间间隔内没有发生心跳检查,服务器可用性观察器将提醒用户可能的网络通信故障或系统崩溃。您还可以在管理> 服务器监视器> 设置页面中自定义此时间间隔,并为设置心跳检查阈值设置适当的值。了解更多。
服务器监控代理将每分钟收集一次数据,对其进行整合,并每五分钟将其传送到 Site24x7 数据中心。只有在任何违反阈值的情况下,代理才会立即与数据中心通信并向用户触发告警。此外,您还可以在 1 分钟、5 分钟、10 分钟、15 分钟、30 分钟、1 小时、3 小时、6 小时、12 小时和一天的范围内设置轮询间隔。
在网络连接失败期间,数据将作为 Zip 文件存储在服务器中。连接恢复后,代理会将积压数据发送到 Site24x7 数据中心。因此,即使在通信失败期间也不会丢失数据。
这确保了与监控服务器的实时通信。与 DMS (dms.zoho.com) 的通信每 30 秒发生一次,并且代理执行由用户触发的多个操作,例如启动/停止进程、发现服务/进程、升级代理、根本原因分析、添加端口、 URL、文件、目录和事件日志/系统日志检查。
服务器监控架构
网络健全性检查:
在报告中断之前,Site24x7 通过执行网络健全性检查来检查其内部网络的可用性状态。这是为了确保它是关闭的资源而不是它的网络。查看可能的中断情况和排除故障的步骤。
代理安全
由于代理必须下载并安装在需要监控的每台服务器上,因此了解其安全性、资源使用情况以及成功安装的先决条件非常重要。了解更多。
操作系统和功能
详细了解支持的平台、可用于一次性在 100 台服务器中安装代理的批量部署选项,以及为每个平台提供的各种性能指标。
插件集成
监控您的数据库、应用程序、Web 服务器、缓存、消息代理并跟踪最重要的数据。看看我们的 50 多个开箱即用插件。如果您没有找到您想要监控的,请使用 适用于 Linux 和VB 的Python 和 Shell 脚本、适用于 Windows 的Powershell、Batch和DLL编写您自己的脚本 。
报表、仪表板和 IT 自动化