蓝鲸监控社区版5.0已发布,让我们一起来探索这一版本如何解决用户关注的告警风暴、zookeeper/kafka这类二进制名相同的进程监控、在设置全局策略后如何为单台机器设置策略以及在windows下如何进行进程端口监控等问题。

1
告警恢复检测机制:告警不再喧嚣
“告警未恢复,持续告警”、“稍微抖动就告警,无法抑制”,这些问题导致系统难以使用…
在本次更新中,我们引入了告警恢复检测机制(下一版本将增加一个告警状态:已恢复),如果告警未恢复,将被抑制,不再产生新的告警。
此外,关于检测算法,小编有以下建议:
对于抖动类指标,如CPU总使用率,N可设为3,以消除抖动;对于非抖动类指标,如磁盘使用率,N可设为1。
2
ZooKeeper/Kafka这类二进制名相同的进程监控
ZooKeeper和Kafka的二进制名称都是java,如何监控?
这次更新增加了一个识别进程的新维度:启动参数。
操作如下,在CMDB中添加进程时填写启动参数的匹配规则。
稿定AI社区
在线AI创意灵感社区
60 查看详情

此外,进程端口监控不再需要用户手动下发采集任务,因为注册进程会自动将进程信息发送至Agent上的/etc/gse/host/hostid目录,监控进程端口的采集器会捕获文件变化,做告警检测,预计延时2分钟。
3
设置了全局策略,但想为单台主机设置策略怎么办?
场景:有一个全局策略,但某台主机非常敏感,想降低其阈值。
告警策略关联特性:监控范围的粒度越细,告警策略的优先级越高,优先生效,其余抑制。
案例:全局CPU使用率阈值为>=95%,windows-agent模块的阈值为>=85%,某一台敏感主机(属于windows-agent模块)的阈值为>=75%。
当CPU使用率为75%时,只有>=75%的策略生效;当CPU使用率为85%时,只有>=85%的策略生效。

4
进程端口监控现在支持Windows了
终于支持Windows下的进程端口监控了,不再展示图片。
以上就是蓝鲸监控社区版5.0:终结满屏告警的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/388760.html
微信扫一扫
支付宝扫一扫