注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
Code Workbook支持用于模板化工作流的多节点模板。一个模板可以由多个其他模板创建,并且可以将这些模板中的参数值绑定在一起。
让我们通过一个例子来了解如何使用titanic_dataset
。我们将对一个工作流进行模板化,选择两个数值列并在两个图表中绘制它们。第一个图表是这两个数值列的散点图。第二个图表是根据数值列筛选乘客是否存活的直方图。
以下是我们正在模板化的工作流的视觉概览:
首先,创建一个从输入数据集中选择两个数值列以及Survived
的模板。将此模板命名为筛选
。
其次,创建一个绘制这两个数值列的散点图的模板。将此模板命名为散点图
。注意,输入数据集被设置为以Pandas dataframe的形式读取。
最后,创建一个基于这两个数值列和两个模板化输入筛选输入数据集的模板。注意,输入数据集被设置为以Spark dataframe的形式读取。
选择所有三个模板,右键点击以打开菜单,然后选择创建新模板。现在你应该能看到模板编辑器。
我们希望链接col1
参数的值,并链接col2
参数的值。首先,点击进入筛选
模板。点击col1
,并在下拉菜单中选择创建共享参数。
在右侧,一个名为col1
的新参数已被创建。在右侧窗格中选择titanic_dataset
作为源数据集。然后,点击进入其他两个模板并选择将col1
链接到新的col1
多节点模板参数。对col2
重复此操作,然后保存多节点模板。
我们之前创建的三个模板现在是多节点模板的一部分。
点击进入筛选
模板。在col1
和col2
参数旁,有一个图标表示此参数值由多节点模板参数控制。
在窗格顶部选择查看组
。现在你可以看到一个视图,突出显示多节点模板中的节点,并列出模板中的共享参数。你可以在此视图中更改col1
和col2
的值,所有三个节点中的实例也将更改。
如果在子节点窗格中更改共享参数的值,该值也将会更改多节点模板中的所有实例。
让我们添加此模板的新实例。
让我们分析Fare
和PClass
。通过在子节点的视图中选择这两列,你会注意到你正在设置整个组的列值。
然后,更新筛选然后直方图
中的截止值。运行模板,我们现在已经为不同的一组数值列创建了相同的图表。