服务器监管称为supervisord。因此,监控supervisord对于由supervisord管理的应用程序进程,其计数以及服务器的整体状态至关重要,以跟踪所有进程或识别有问题的进程。
本文档详细介绍了如何配置Supervisor插件和监控指标,以深入了解supervisord服务器的性能,可用性和使用情况统计信息。
Supervisor服务器监控指标:
Site24x7插件提供富有洞察力的可视化和及时告警,以确保您的监管实例的持续运行。
我们支持的各种开箱即用指标包括:
监督服务器的状态
在由supervisord服务器执行的许多功能中,它启动由客户端启动的进程,重新启动失败或退出的进程并响应来自客户端的命令。因此,了解supervisord服务器的状态以管理应用程序的长时间运行流程至关重要
进程总数
监管将流程作为子流程启动并对其进行分组。因此,知道由supervisord服务器管理的total_process_count给出了关于supervisord管理进程如何执行的想法。
已停止的进程数
stopped_process_count给出了supervisord服务器停止的进程总数
正在运行的进程数
running_process_count是supervisord服务器中当前活动的进程数
状态未知的进程数
unknown_status_process_count是既未运行也未停止的进程数
这个怎么运作?
先决条件:
- Site24X7 supervisord插件使用Python的“supervisor”包来收集指标
sudo pip install supervisor
或者
sudo easy_install supervisor
Supervisor插件安装:
- 在Site24x7 Linux代理插件目录下创建一个名为“supervisord”的目录 - / opt / site24x7 / monagent / plugins /
- 从我们的GitHub存储库下载supervisord.py并将其放在“supervisord”目录下
- 插件脚本中给出的默认python路径是#!/ usr / bin / python。如果您希望提供备用python路径,请替换前面带有shebang字符“#!”的现有路径。
- 更改SERVER_URL,USER_NAME,PASSWORD和MONITOR_PROCESS_NAMES的值以匹配您的配置
- 服务器代理将在Site24x7 Web客户端的“插件”选项卡下报表有关supervisord性能的统计信息。如果该插件未在Site24x7 Web客户端中列出,请重新启动该代理。
sudo mkdir supervisord
sudo wget https://raw.githubusercontent.com/site24x7/plugins/master/supervisord/supervisord.py
sudo /etc/init.d/site24x7monagent restart
监控其他指标:
- 要监控其他指标,请编辑“supervisord.py”文件并添加需要监控的新指标
- 增加文件中的插件版本值以查看新添加的度量标准(例如,将默认插件版本从PLUGIN_VERSION =“1”更改为“PLUGIN_VERSION =”2“)
相关插件:
- ActiveMQ插件 - 监控ActiveMQ实例的性能指标
- CouchDB插件 - 监控Apache CouchDB数据库的性能指标
- Postgres插件 - 分析Postgres服务器的性能
- Nagios插件 - 在Site24x7中执行数千个Nagios插件,无需运行Nagios服务器
- 开箱即用的插件 - 使用我们广泛的集成列表监控整个应用程序堆栈
- 创建自定义插件 - 创建自定义Linux和Windows插件并监视自定义属性