注意：以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

概览

Pipeline Builder 为在 Foundry 中变换数据提供了一个灵活、强大且易于使用的界面。在现有工具（例如 Spark 或 SQL）中编写数据变换对于非编码人员和有经验的软件开发人员来说都是具有挑战性且容易出错的。此外，现有工具通常与一个特定的执行引擎耦合，并需要使用代码库来表达数据变换。

Pipeline Builder 使用一个通用模型来描述数据变换。这个后端是用于编写变换的工具与执行这些变换之间的中间层。

Pipeline Builder 后端工作原理图

Pipeline Builder 的底层架构旨在支持各种输出——数据集、本体对象、流、时间序列以及导出到外部系统。您可以运行用于数据集、对象类型、链接类型的批处理管道，或与流数据集对应的流式管道。

在 Pipeline Builder 中使用变换

在 Pipeline Builder 中，您可以使用两种类型的数据变换：表达式和变换。表达式以表中的列为输入并输出单列（例如 Split string），而变换以整个表为输入并返回整个表（例如，Pivot 或 Filter）。

我们在相同的配置界面中将表达式和变换分组在一起。例如，您可以在表达式如 Cast 和 Concatenate strings 旁边找到 Drop columns 变换。这允许您在同一路径中同时使用表达式和变换，并在一个配置表单中将表达式嵌入到变换中，如下所示，通过将 Length 表达式插入到下面的 Filter 变换中。

显示筛选变换的配置截图