Zabbix 无代理监控 Linux:完整指南
Zabbix 无代理监控 Linux 的逐步指南
在当今的 DevOps 工作流程中,高效监控基础设施至关重要。Zabbix 是一个强大的监控解决方案,提供基于代理和无代理的监控功能。在本文中,我们将重点介绍 Linux 系统的无代理监控,使管理员能够更轻松地跟踪性能并确保系统健康,而无需部署代理。
什么是 Zabbix 无代理监控?
无代理监控允许您在不安装 Zabbix 代理的情况下收集系统指标、日志和性能数据。相反,它使用原生协议,例如:
- SSH:对于 Linux 系统,这是用于远程监控的主要协议。
- SNMP:适用于网络设备和某些服务器。
- IPMI:用于硬件健康监控。
- HTTP/HTTPS:用于监控 Web 服务和 API。
为什么选择无代理监控?
- 易于设置:无需安装或配置代理。
- 轻量级:适用于遗留系统或具有严格合规性要求的环境。
- 安全性:利用现有的安全通信协议,如 SSH。
Zabbix 无代理监控 Linux 的逐步指南
步骤 -1:在目标系统上启用 SSH
要启用 SSH 监控,请确保 SSH 服务在目标 Linux 主机上运行:
允许 Zabbix 服务器连接,将其公钥添加到目标系统:
sudo mkdir -p /root/.ssh
sudo echo "" >> /root/.ssh/authorized_keys
sudo chmod 600 /root/.ssh/authorized_keys
步骤 0:配置 Zabbix 服务器
- 登录 Zabbix Web UI。
- 导航到 配置 > 主机 > 创建主机。
- 填写所需信息:
- 主机名:目标系统的名称。
- IP/DNS:Linux 主机的地址。
- 模板:附加相关模板(例如,“Template OS Linux by SSH”)
步骤 1:创建新模板:
导航到数据收集 → 模板
创建新模板
- 模板名称:Template Linux by SSH-Agentless
- 模板组:Template operating system
步骤 2:创建项目
2.1 主项目:
导航到我们创建的模板并创建一个 新 项目。
- 名称: SSH Get
- 类型: SSH 代理
- 键: ssh.run[ssh.get,{$SSH.IP},{$SSH.PORT},,]
- 信息类型:文本
- 认证方法:密码
- 更新间隔: 根据您的监控需求
- 执行脚本:
#!/bin/bash
mpstat && uptime && free
Zabbix: 项目- SSH get
步骤 3:创建依赖项目
配置 Zabbix 依赖项目的步骤
- 导航到收集 uptime 命令输出的主机/项目。
- 创建 主项目(SSH get 作为输出)。
- 添加每个 依赖项目 并将其链接到主项目。
- 为每个依赖项目使用预处理规则。
- 测试配置以确保正确提取值。
使用 SSH get 作为主项目,并使用预处理步骤提取以下依赖项目:
Zabbix: 项目
3.1 系统运行时间
- 键:ssh..uptime
- 主项目:ssh.get
- 预处理:
正则表达式模式:up\s+(.+)?,结果:\1
Zabbix: 项目-系统.uptime
3.2 内核版本
- 键:ssh.kernel.version
- 主项目:ssh.get
- 预处理:使用正则表达式过滤内核
3.3 架构类型 (aarch)
- 键:ssh.arch.type
- 主项目:ssh.get
- 预处理:使用正则表达式过滤 aarch
3.4 操作系统类型
- 键:ssh.os.type
- 主项目:ssh.get
- 预处理:使用正则表达式过滤操作系统
3.5 CPU 数量
- 键:ssh.cpu.count
- 主项目:ssh.get
- 预处理:使用正则表达式过滤 CPU
3.6 CPU 空闲
- 键:ssh.cpu.idle
- 主项目:ssh.get
- 预处理:
正则表达式模式:all\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+[0–9.]+\s+([0–9.]+) 结果:\1
Zabbix 项目:系统.cpu.idle
3.7 其他指标(遵循相同流程):
- ssh.cpu.user (用户 CPU)
- ssh.cpu.system (系统 CPU)
- ssh.cpu.iowait (IO 等待)
- ssh.cpu.irq (IRQ)
3.8 内存:
总内存
- 键:ssh.memory.total
- 主项目:ssh.get
- 信息类型:数字(无符号)
- 预处理:
正则表达式: 模式:.*Mem:\s+(\d+).*结果:\1
- 自定义乘数:1024
其他指标(遵循相同流程):
- ssh.memory.used (已用内存)
- ssh.memory.free (空闲内存)
- ssh.memory.shared (共享内存)
- ssh.memory.buffcache (缓冲区/缓存)
- ssh.memory.available (可用内存)
步骤 4:创建图表
4.1 CPU 利用率图表
- 创建一个名为 CPU 利用率 的新图表。
- 添加项目:
- ssh.cpu.user
- ssh.cpu.system
- ssh.cpu.idle
- ssh.cpu.iowait
Zabbix: 图表-CPU
4.2 内存利用率图表
- 创建一个名为 内存利用率 的新图表。
- 添加项目:
- ssh.memory.used
- ssh.memory.free
- ssh.memory.available
Zabbix: 图表
步骤 5:创建触发器
5.1 系统名称更改
- 名称:系统名称已更改
- 表达式:
{Template Linux By SSH-Agentless:ssh.os.type.diff()}=1
- 严重性:信息。
5.2 CPU 数量更改
- 名称:CPU 数量已更改
- 表达式:
{Template Linux By SSH-Agentless:ssh.cpu.count.diff()}=1
- 严重性:警告。
5.3 内核更改
- 名称:内核版本已更改
- 表达式:
{Template Linux By SSH-Agentless:ssh.kernel.version.diff()}=1
- 严重性:警告。
5.4 CPU 使用率触发器
80% 持续 5 分钟
- 名称:高 CPU 使用率 (80%)
- 表达式:
{Template Linux By SSH-Agentless:ssh.cpu.user.avg(5m)}>80
- 严重性:高。
5.5 90% 持续 5 分钟
- 名称:严重 CPU 使用率 (90%)
- 表达式:
{Template Linux By SSH-Agentless:ssh.cpu.user.avg(5m)}>90
- 严重性:灾难。
内存使用率触发器
5.6 内存 80% 持续 5 分钟
- 名称:高内存使用率 (80%)
- 表达式:
{Template Linux By SSH-Agentless:ssh.memory.used.avg(5m)} > 0.8 * {Template Linux By SSH-Agentless:ssh.memory.total.last()}
- 严重性:高。
5.7 内存 90% 持续 5 分钟
- 名称:严重内存使用率 (90%)
- 表达式:
{Template Linux By SSH-Agentless:ssh.memory.used.avg(5m)} > 0.9 * {Template Linux By SSH-Agentless:ssh.memory.total.last()}
- 严重性:灾难。
5.8 系统重启
- 名称:系统已重启
- 表达式:
{Template Linux By SSH-Agentless:ssh.system.uptime.last()}<300
- 严重性:警告。
5.9 SSH 无法连接
- 名称:SSH 连接失败
- 表达式:
{Template Linux By SSH-Agentless:ssh.metrics.nodata(300)}=1
- 严重性:高。
5.10 最后 2 次无数据
- 名称:2 个间隔无数据
- 表达式:
{Template Linux By SSH-Agentless:ssh.metrics.nodata(600)}=1
- 严重性:警告。
通过遵循这些步骤,您将拥有一个强大的 SSH 无代理监控模板,用于 Linux,包含详细的指标、图表和主动触发器。
关键词
- Zabbix 无代理监控
- 使用 SSH 监控 Linux
- 基于 SSH 的系统指标
- CPU 和内存监控
- Zabbix SSH 监控指南
结论
Zabbix 无代理监控提供了一种强大而灵活的解决方案,用于在不安装额外软件的情况下跟踪 Linux 系统性能。通过利用 SSH,您可以有效地监控 CPU、内存、运行时间和其他关键指标。立即开始使用 Zabbix 无代理监控,简化您的基础设施管理。