监控概念
本节介绍了有关如何最佳利用 Neo4j Ops Manager 监控系统的基本概念。
条件
**条件** 指定受监控实体达到特定状态时的约束。条件会定期评估,评估结果会保存起来。
条件有两种**类型**
-
**基于事件的条件**:当监控子系统生成特定事件时,条件将评估为**true**。例如:“检测到不可达/离线代理”、“连接了不兼容代理”。
-
**基于指标的条件**:当分配给它的指标发生变化,使其表达式评估为**true**时,条件将评估为**true**。例如:“主机 CPU 使用率超过 80% 持续超过 2 分钟”。
条件可以有**宽限期**。如果有宽限期,则意味着该条件只有在宽限期内的所有**评估**都评估为**true**时,才评估为**true**。
如果条件评估为**true**,Ops Manager 会通过以下方式让管理员知道
-
生成警报,并在 NOM UI 中以横幅、警报计数和警报列表的形式显示。
-
生成通知,并将消息发送到其中一个已定义的目标。
可以在警报页面的条件选项卡中按 DBMS 管理条件。
有关如何管理条件的信息,请参阅 管理警报。
警报
**警报** 在 NOM UI 中显示,以通知管理员评估为**true** 的条件。
如果受管系统中存在警报,Ops Manager 会提供有关警报的以下信息
-
警报总数显示在侧边栏中。
-
每个 DBMS 的警报计数显示在 DBMS 下拉菜单中(适用于所有可访问的 DBMS)和侧边栏中(适用于当前选定的 DBMS)。
-
显示警报横幅,允许管理员显示警报详细信息或 DBMS 指标。
-
可以在 DBMS 的警报页面或主页(在选定 DBMS 的警报面板中)查看详细的警报信息。
有关如何管理警报的信息,请参阅 管理条件。
通知
虽然警报只在 NOM 浏览器页面中显示,但通知可以将有关触发条件的信息发送到外部系统,例如电子邮件服务器或其他消息传递系统。
有关如何管理通知、通道和目标的信息,请参阅 通知。