下午发现个zabbix报警升级的缺陷,不过还好发现的及时,不然肯定出大问题。我来描述下:打个比方 比如我检查一个东西 低于30家报警;我设定了报警等级1-0无限报警,默认步骤是4个小时一次;
然后前几天他出问题了,29家,报警了,然后这个事件,我觉得29家就先放着吧,因为某些因素现在没法清理,我没去解决所以他一直存在。
然后,就这样。低于25家了,他还在持续。报警还是会发。但是 内容还是29家时候的内容,我也没在意。
下午我没事的时候去关注了下这个问题,直接出冷汗。怎么这里显示是5家。然后我跑到机器上试了下采集数据的脚本,没问题,好吧。然后转了下思路,跑去web界面,查了下事件。。我了个去,N个事件,然后发现短信内容全部一样。
然后到群里问了下绿肥,他也说了有这个问题的缺陷。然后这个问题总得解决吧,然后想了下,之前研究zabbix那会出现过1分就能报1次的情况。
于是想了下,既然现在是想让他4个小时报1次的,妥了,不用报警升级了。直接在这里设置了:Multiple PROBLEM events 这里选定了下,(每触发1次,就会去报警一次且内容是最新的。)你可以说你没用报警升级,但是就算没设定报警升级,他的状态一直存在,事件不转变,也就给你发一次短信是吧。
弊端:选了多事件产生后 报警等级就无效了。感觉zabbix官方应该要处理下这个问题吧。期待