分析代码工作簿Templates多节点模板

注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

多节点模板

Code Workbook支持用于模板化工作流的多节点模板。一个模板可以由多个其他模板创建,并且可以将这些模板中的参数值绑定在一起。

让我们通过一个例子来了解如何使用titanic_dataset。我们将对一个工作流进行模板化,选择两个数值列并在两个图表中绘制它们。第一个图表是这两个数值列的散点图。第二个图表是根据数值列筛选乘客是否存活的直方图。

以下是我们正在模板化的工作流的视觉概览:

mnt_workflow.png

创建模板

首先,创建一个从输入数据集中选择两个数值列以及Survived的模板。将此模板命名为筛选

filter_template

其次,创建一个绘制这两个数值列的散点图的模板。将此模板命名为散点图。注意,输入数据集被设置为以Pandas dataframe的形式读取。

scatterplot_template

最后,创建一个基于这两个数值列和两个模板化输入筛选输入数据集的模板。注意,输入数据集被设置为以Spark dataframe的形式读取。

filter_then_histogram

创建多节点模板

选择所有三个模板,右键点击以打开菜单,然后选择创建新模板。现在你应该能看到模板编辑器。

creating_multi_node_template

我们希望链接col1参数的值,并链接col2参数的值。首先,点击进入筛选模板。点击col1,并在下拉菜单中选择创建共享参数

shared-mnt-parameter

在右侧,一个名为col1的新参数已被创建。在右侧窗格中选择titanic_dataset作为源数据集。然后,点击进入其他两个模板并选择将col1链接到新的col1多节点模板参数。对col2重复此操作,然后保存多节点模板。

使用多节点模板

我们之前创建的三个模板现在是多节点模板的一部分。

点击进入筛选模板。在col1col2参数旁,有一个图标表示此参数值由多节点模板参数控制。

mnt_logic_pane_1

在窗格顶部选择查看组。现在你可以看到一个视图,突出显示多节点模板中的节点,并列出模板中的共享参数。你可以在此视图中更改col1col2的值,所有三个节点中的实例也将更改。

mnt_logic_pane_2

如果在子节点窗格中更改共享参数的值,该值也将会更改多节点模板中的所有实例。

让我们添加此模板的新实例。

add-new-mnt-titanic.png

让我们分析FarePClass。通过在子节点的视图中选择这两列,你会注意到你正在设置整个组的列值。

mnt_workflow_new_instance

然后,更新筛选然后直方图中的截止值。运行模板,我们现在已经为不同的一组数值列创建了相同的图表。