分析代码工作簿Workbooks概述

注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

概述

在 Code Workbook 中,您交互的主要资源是 Workbook。Workbooks 用于从 Foundry 导入数据集并变换这些输入数据集,以实现以下目的:

  • 清理和合并从外部来源导入的原始数据,以生成为其他用户准备的精心设计的数据集。
  • 分析处理过的数据源以获取有用的洞察。
  • 训练和应用模型进行预测分析。
  • 创建参数化可视化以在报告中显示。

图表

Workbook 界面的核心组件是图表。图表表示数据如何通过 Workbook 中的逻辑步骤流动以生成输出。

workbooks-graph

输入数据集从 Foundry 的其他地方导入,以用作 workbook 中的源数据。除了输入数据集,图表中的每个节点代表一个 变换。变换是一段可以返回输出数据框或模型的逻辑,并可能呈现可视化。变换可以保存为派生 数据集。当变换保存为派生数据集时,运行变换将自动将结果写入 Foundry,使其可以在此 Code Workbook 之外使用,并轻松与他人分享。

Code Workbook 中有三种类型的变换可用:

  • 代码变换允许您编写代码来处理输入并返回结果。
  • 模板变换提供了一个基于表单的界面来进行变换代码,使得代码的重用和共享变得简单。
  • 手动输入变换允许用户在节点中输入数据。

导航图表

单击图表中的任何变换以打开界面底部的 逻辑 面板。这使您可以查看和编辑变换逻辑并查看变换输出。您可以在 Windows 上使用 Ctrl+Click 或在 macOS 上使用 Cmd+Click 在图表中选择多个变换。

Screenshot of logic panel

为帮助导航大型 Workbook,您可以使用图表左下方的缩放选项,其中包括一个 适合缩放 按钮,可以缩放图表以将所有变换显示出来。

与变换交互

与变换交互的一个关键方式是通过 上下文菜单,您可以通过单击图表中每个变换右上角的省略号(...)或在图表或侧边栏中右键单击变换来打开上下文菜单。

workbooks-context-menu

此菜单提供一系列有用的操作,包括添加新的下游变换、运行与此数据集关联的变换或从 Workbook 中删除此变换。对于保存为数据集的变换,操作 选项允许您访问与数据集相关的常规 Foundry 操作。

如果您选择多个变换(通过在 Windows 上使用 Ctrl+Click 或在 macOS 上使用 Cmd+Click),您可以在图表上的任意位置右键单击以打开所有选定变换的上下文菜单。这对于添加具有多个输入的新变换或一次运行多个变换很有帮助。

将鼠标悬停在 workbook 中的数据集名称上将打开一个工具提示,其中包含 Foundry 中数据集的完整路径。

路径

您可以在 workbook 顶部切换到路径视图。路径视图是一种替代模式,允许在 workbook 内进行线性开发。路径视图非常适合于钻取一个数据集并执行顺序变换步骤的工作流程。

paths_1

路径可以从导入到 workbook 的数据集或在 workbook 中创建的变换开始。在路径视图中,使用左侧边栏在路径之间导航。

在路径视图中创建的所有变换也会保留在图表中。通过单击路径节点上的 在图表中打开变换 图标 (Open transform in Graph icon) 从路径节点导航到图表。

在图表中,您可以通过查看节点之间边缘上的注释来查看哪些节点是路径的一部分。将鼠标悬停在注释上以打开源路径。

path_graph_interaction

您还可以单击节点上的路径图标以在其源路径中打开它。

Open path from Graph

全屏编辑器

您可能希望专注于一个变换并在全屏模式下与该变换交互。在图表或路径视图中,单击给定节点上的扩展按钮 (Expand icon 以在全屏编辑器中查看。

Hovering over expand icon to open full screen editor

在全屏模式下,您可以通过使用停靠操作或拖放来重新排列选项卡以同时查看两个选项卡。

Screenshot of Full Screen Editor

要退出全屏编辑器并返回图表或路径,使用 Esc 键或选择折叠按钮 (Collapse icon)。

窗格

Code Workbook 具有三个界面窗格 - 内容全局代码控制台 - 它们始终可从图表、路径视图和全屏编辑器中访问。

Screenshot of Code Workbook interface showing the three panes

内容

在界面的左侧,单击 内容 栏以打开 Workbook 内容窗格。

在图表模式下,内容窗格显示图表中所有变换的列表,以便总结整个 Workbook。默认情况下,此变换列表按拓扑顺序排序;输入数据集在顶部,最远的下游变换在底部。列表中每个变换旁边都有一个缩放按钮,可以将图表居中于此变换。您还可以使用空格键放大选定的变换。单击 编辑已保存的数据集 以更改哪些变换(如果有)保存为数据集。

在路径视图中,内容窗格显示 workbook 中所有变换的迷你图表,允许在节点之间快速导航。

全局代码

使用 Workbook 界面右侧的全局代码窗格来定义代码(如变量或函数),这些代码将在整个 Workbook 的所有代码变换中可用。例如,您可以使用全局代码定义将在多个变换中使用的常量或定义您希望重复使用的辅助函数。了解更多关于如何使用全局代码的信息。

控制台

在 workbook 的右侧,控制台提供了一个 REPL(读-评估-打印循环),能够对图表上的任何数据集进行快速的临时分析。了解更多关于如何在每种 Workbook 语言中使用控制台的信息。

在控制台下方,使用变量窗格设置控制台中给定变换的输入类型。

如果控制台命令返回一个数据框,您可以使用 + 添加到图表 按钮将控制台命令转换为变换。这允许您在将逻辑提升为可重复的变换之前,在控制台中进行实验。

您可以使用 键盘快捷键 在 Windows 上使用 Ctrl+Shift+Enter 或在 macOS 上使用 Cmd+Shift+Enter 将代码从变换直接发送到控制台。

console-add-to-graph