注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
流监控使您能够对管道的健康状态进行警报。
当管道具备以下条件时,被视为“健康”:
您可以通过设置摄取和输出警报来监控管道的健康状态,当摄取或输出的记录数量在某个时间段内低于用户定义的阈值时,会触发警报。
例如,如果您的流在过去五分钟内摄取了零记录,可以设置摄取监控器发出警报,而如果您的流在过去30分钟内输出了少于1000条记录,可以设置输出监控器发出警报。
摄取监控器确保:
要进行配置:
示例:
摄取记录数
持续时间为五分钟,阈值为零:当您的流在过去五分钟内向实时视图写入零记录时发出警报。摄取记录数
持续时间为30分钟,阈值为1000:当您的流在过去30分钟内向实时视图写入少于或等于1000条记录时发出警报。输出监控器确保您的管道:
要监控写入时间序列的记录,您需要在时间序列同步上设置警报。
示例:
写入时间序列数据库的点数
持续时间为五分钟,阈值为零:当您的时间序列同步在过去五分钟内写入零记录时发出警报。写入时间序列数据库的点数
持续时间为30分钟,阈值为1000:当您的时间序列同步在过去30分钟内写入少于或等于1000条记录时发出警报。要监控地理时间观察,您需要在支持观察数据集上设置警报。
示例:
发送的地理时间观察
持续时间为五分钟,阈值为零:当您的地理时间同步在过去五分钟内发送零个观察到地理时间时发出警报。发送的地理时间观察
持续时间为30分钟,阈值为1000:当您的地理时间同步在过去30分钟内发送少于或等于1000个观察到地理时间时发出警报。发送的地理时间观察
仅确保记录已从地理时间摄取发送。这并不保证地理时间服务在摄取后已处理记录。要查看监控器下的指标,请在监控视图的 管理监控器 选项卡中选择监控规则行。
指标仅适用于具有单一目标范围的流或时间序列监控器。
您可以通过监控视图的 管理订阅 选项卡配置通知。
要设置电子邮件警报:
要设置PagerDuty警报:
您可以在监控视图的 故障排除警报 选项卡中查看触发的警报。