上一小节中讲了如何进行添加主机,按照流程来说我们进行到了 “监控项目” 这部分内容了
那么开始我们的操作~
本小节内容:
环境说明:
zabbix_server : 192.168.20.128
被简单监控主机:192.168.20.129
1、添加 “fping”
我们 “简单监控” 的话首先需要在zabbix_server 上安装 “fping” 才可以进行,那么我们在 192.168.20.128 这台服务器上安装一下:
[root@bogon ~]# cd /home/zabbix/[root@bogon zabbix]# yum install epel-release
如图所示即表示OK
而后安装 “fping”:
[root@bogon zabbix]# yum -y install fping
结果如下图:
2、主机存活监控添加
依次点击 “配置” --> “主机” --> “监控项”
点击右上角 “创建监控项”
首先需要注意下图中的五个参数:
参数解释:
名称:就是你创建这个监控项目的名字,我在这里设置的名字是 host_survival(汉译:主机_存活)
类型:我们此处选择 “简单监控”
健值:这里选择 icicmpping 后面的参数可以直接删除,我在这里没有用到参数,所以直接删除了(PS:这里一般不要手动输入,要在列表中选择)如图
在下面的图中也清晰的说明了,监控之后返回的值是什么,可以看到如果返回“0”,表示失败,返回“1”,表示成功
信息类型:
在这里我们选择“数字”这个类型,因为上图可以看到,监控之后返回的信息只有 “0” 或者 “1” 没有其他返回,所以此处 “数字” 类型是最适合我们的
更新间隔:每隔多久时间来进行触发一次本监控项目;
而后我们继续往下看监控项目的添加:
上面的应该都可以理解,需要注意一项 “时长”, 理解 “应用集”:
时长:不要以为90天很短,我们可以简单来计算一下:
相当于一个简单监控的项目,如果你要保留90天的数据,那么这么一个项目就要有259200条数据,而我们实际生产中,比如有100台主机,每台主机监控20个项目,那么总数量就是 518400000,相当于5个亿的数据,而且,还需要经常读取,所以在设置时长的时候一定要结合实际情况来设定,并不是说时长越长越好;
应用集:就是说你现在创建的监控项目处于哪一个集合,为了后期方便管理
而后点击最下方的 “添加” 按钮,这个时候我们会自动跳转到添加监控项的对应界面:
显示,监控项已经添加,且我们添加的监控项已经显示出来了
那么我们去哪里看是否监控成功了呢?
点击 “监测” --> “最新数据”
而后我们在 “主机群组” 中写上我们之前创建的 “huaxin_ceshi” 的群组,而后点击 “应用” 按钮:
就可以看到我们刚才添加的监控项目,已经有了展示;
3、添加主机丢包率监控
这次只上图,不一一解释了,上面已经做出了详细解释:
next:
host_loss_package 汉译:主机_丢_包
健值:icmppingloss
next:
从上图中我们需要删除健值的参数,以及信息类型选择“浮点数”,单位选择 “%”
next:
next:
从上图可以看出已经添加了两个监控项目了,我们再次去看下数据:
点击 “监测” --> “最新数据”
这个图需要看懂哈,如下图所示:
上图释义:
被监控主机 “ceshi_129” 在 "loss_package" 应用集中的监控项 “host_loss_package” 中,显示的丢包率是 “0%”;
被监控主机 “ceshi_129” 在 “curvival” 应用集中的监控项 “host_curvival” 中,显示的数据是 “1” ,就表示这台主机是存活的。
4、监控指定主机的指定端口
点击 “配置” --> “主机” --> “监控项”
右上角 “创建监控项”:
next:
这次我的健值选择 “net.tcp.service” ,但是这次需要主机这个健值的参数书写:
net.tcp.service[service,,]
后面一共有三个参数 service,ip,port
service:监控类型,比如说是TCP,或者是ICMP,这里我们的选择是 TCP
IP地址:无需指定,为空即可
port:这里写上欲监控的端口号,本次是 “22”
所以最后的书写方式应该是:
PS:一定要注意是中间有两个逗号哈,因为我们的 “ip” 参数是空,所以可以不写,但是逗号不能丢,故而是两个逗号
net.tcp.service[service,,22]
如图所示:
next:
着这里我们不创建新的应用集,选择之前创建的 “curvival” 应用集,即可;
点击 “添加” 按钮,返回截图如下:
再次去查看下监控数据:
点击 “监测” --> “最新数据”
5、添加监控项使用 “克隆” 和 “变量”
点击 “配置” --> “主机” --> “监控项”
这次不选择“创建监控项”了,点击我们刚刚创建的监控项目“host_curvival_port_22”监控项目
在新的界面中,拉倒最下面,选择 “克隆” 按钮:
如图所示,我们修改了名称中的 “22” ,写成了 “$3” 意思就是说调用健值 “net.tcp.service” 中的第三个参数 “80” ,而后点击最下面的 “添加” 按钮;
而后返回如下界面:
可以看到 “$3” 直接变成了我们参数中的 “80” ,我们去看一下监控数据:
点击 “监测” --> “最新数据”
因为我们的192.168.20.129这台服务器的80端口没有开启,所以返回的数据是0;
6、如果我们的健值写错了,怎么办
很简单,重新点击我们对应的监控项,修改正确就行,不过这个时候我们需要注意一个时间,那就是如果我们的健值写错了,会显示如下图所示:
在 “监测” --> “最新数据” 中显示,灰色,如下图所示:
而后点击 “配置” --> “主机” --> “监控项”,会显示如下图所示:
PS:这个错误的健值是我刚刚自己把它改错了,为了做演示
点击对应监控项,修改正确:
而后点击最下方的 “更新” 按钮即可:
但是,重要的是你会发现你等了很久,他还是显示不支持,这是为什么呢?
因为zabbix默认的是,如果监测出来了健值不匹配,那么他默认的时间是 10分钟 之后才会再次去进行检查,那么这个时间我们是可以自行进行修改的,如下:
点击 “管理” --> “一般”
而后在右上角的下拉列表中选择 “其他”:
修改时长为30s:
而后点击“更新”按钮,即可;
之后默默等待30S。。。
从上图可以看出,已经重新监测,并显示出来了数据。
至此,本小节内容完毕,继续加油~