注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
您可以选择以快照或增量方式读取输入数据集,具体取决于您的应用案例。
快照计算对整个输入执行变换,而不仅仅是新添加的数据。输出数据集在每次搭建时由最新的管道输出完全替换。
最佳使用场景:
APPEND
事务更新。
SNAPSHOT
事务写入时,无法增量读取输入。APPEND
事务更新。
增量计算仅对自上次搭建以来追加到选定输入的新数据执行变换。这可以减少计算资源的使用,但有重要的限制。
只有在选定输入数据集通过不修改现有文件的APPEND
或UPDATE
事务更改时,管道才会以增量计算运行。将快照输入标记为增量将无效。
最佳使用场景:
APPEND
事务或附加的UPDATE
事务更改。
本节概述了可能适用于您的工作流程的限制。在设置增量计算之前,请仔细检查以确保正确实施。
有关更多信息,请参见Pipeline Builder中的增量计算示例。