注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
监控数据管道的过程通常最好通过实施值班轮换来管理。这意味着一次有一名团队成员积极监控数据管道(“值班”),并将响应数据管道问题(通常是健康检查失败的形式)作为她值班期间的最重要优先事项。
以下步骤推荐用于建立一个有效的数据管道监控团队:
documentation
文件夹中,即数据管道关键输出所在的位置。警报机制允许您对数据管道中健康检查失败做出反应。这减少了定期查看数据沿袭图、仪表盘或报告以了解数据管道状态的需要。选择适当的警报机制取决于警报的规模和您的SLA的紧密程度(因为这决定了响应时间的关键性)。
可用的自动警报选项包括:
无论您实施哪个选项,实施筛选以避免在其他Foundry平台通知中遗漏警报都是有益的。