注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

概述

随着数据管道被创建并投入生产以支持各种应用案例,一些管道可能会达到不再积极开发的状态,此时的重点主要是管道维护。

本页面侧重于管道维护者的职责,以及将管道引入维护模式的先决条件:

本节的其余部分描述了管道维护的最佳实践和方法:

先决条件和期望

在您开始维护管道之前,明确为其定义的期望是非常重要的。这将帮助您设定现实的警报阈值,优先处理管道上的维护工作和警报,划分团队之间的责任,最重要的是,确保管道满足用户的需求。

本节中的最佳实践假定您已经捕获了以下期望:

  • 管道范围内的数据是什么
  • 交付了什么数据
  • 数据何时交付
  • 数据何时应当搭建
    • 特别是管道是否应在周末运行
  • 数据理想更新的频率
  • 何时数据被认为是严重过时的

管道维护职责

管道维护者的职责包括:

  • 设置管道监控的技术方面
  • 当管道出现故障时进行调试(当健康检查失败时)
  • 在必要时进行代码更改和/或修改监控设置
  • 当数据不正确或未按时接收时,联系上游团队

为了履行这些职责,建议管道维护者具备以下技能和访问权限:

  • 数据访问(如有可能,建议):适当的数据访问将使调试数据问题成为可能。
  • 技术技能(建议):管道监控团队成员应能够阅读代码并使用管道开发工具,如代码仓库、搭建、数据沿袭和数据健康。这确保他们能够有效地解释和分流整个管道中的问题。
  • 熟悉管道架构(非必填):团队成员在开始监控之前应熟悉管道。这可以通过文档和基础设施知识管理来促进。