注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
在Pipeline Builder中,另一种变换和结构化数据的方法是应用合并。合并将两个数据集组合在一起,以包括每个数据集中的所有行。在Pipeline Builder中,合并保留所有行,包括重复行。
要将两个数据集合并在一起,请在您的工作区中选择第一个数据集节点并点击合并。
第一个选择的数据集是左侧数据集。选择另一个数据集节点作为右侧数据集。点击开始以导航到合并输出预览页面。
在预览窗格中,点击创建合并,然后查看输出数据集预览。
合并要求所有输入具有相同的模式。如果输入模式不完全匹配,合并将显示出错消息并列出缺失的列。
要解决此问题,请删除对缺失列的引用或检查您的输入。
一旦完成创建合并,点击应用以将合并添加到您的工作流程中。您将在图中看到合并节点连接到两个已合并的数据集。我们将新的合并命名为Union
,它是原始Correct columns
和Vendor Cut 2 - demo data
数据集的直接输出。
您可以通过点击合并节点并选择编辑来重命名或编辑合并。
拖动节点上的白色或灰色圆圈以更改连接并移除图中的链接。点击合并节点上的灰色椭圆以移除多个连接。
请记住,合并保留来自右侧和左侧数据集的所有行,包括重复行。要移除重复行,请在您的合并输出中添加一个删除重复
变换。