注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
数据集视图由以下主要组件组成:
页面头部标识所选数据集并提供基本信息,如:名称、显示名称(如果存在)、位置和所选分支。它还允许一些与文件相关的操作,如共享、移动、重命名等。
信息面板提供有关数据集(元数据)的信息,并提供一些基本的管理操作。它分为三个部分:
历史视图提供历史任务(搭建)信息。页面右侧的摘要视图显示任务状态随时间的汇总信息。
在左侧面板中,显示任务列表及其状态和持续时间。选择后,右侧会显示详细的任务视图,显示详细的任务信息,包括:任务进度、任务规格、搭建日志、文件和生成的模式。
在流数据集中,只有当视图设置为存档时,历史标签才会出现。历史标签将显示存档事务以及流任务。
详情视图提供有关数据集的附加技术信息以及一些管理操作:
当数据集是流数据集时,流标签将显示当前和历史流任务的信息。通过更改时间段,可以查看在该时间段内流式传输数据集的任务日志和详情。
健康标签提供监控数据健康的工具。
在流数据集中,只有当视图设置为存档时,健康标签才会出现。检查将指向存档数据集而非流。
使用比较标签来比较两个不同的数据集。点击标签并选择一个数据集进行比较。比较标签可以用于多种方式:
在流数据集中,只有当视图设置为存档时,比较标签才会出现。然后您可以将存档数据集与其他非流数据集进行比较。
数据集预览表显示数据样本,并允许对完整数据集进行轻量交互。使用预览表来了解数据结构并快速浏览数据集中的值。
默认情况下,预览表将显示有限的数据样本;确切的行数显示在预览表头部。然而,任何对数据采取的操作,如筛选或排序,都将应用于完整数据集并增加预览样本大小。根据行数,您可能无法在预览中看到整个数据集。
预览表提供多种有用的功能:
流数据预览提供最近流数据行的小样本。当设置为实时更新时,将自动更新。排序、筛选和图表生成仅在页面设置为存档时可用,并且仅表示存档数据集的状态。
在数据集预览中,您可以将以下类型的文件直接上传到数据集中:.csv
、.tsv
、.xls
、.xlsm
和.xlsx
。
对于.csv
和.tsv
文件,Foundry将尝试推断新文件的模式。如果新文件的文件名和模式与之前上传的文件相同,您可以在现有数据集中更新数据。如果文件名与之前上传的文件不同,您可以将数据追加到现有数据集中。
以下步骤适用于上传所有文件类型:
操作菜单提供对Foundry工具和操作的快速访问,使您能够分析、探索、变换和管理数据。某些操作,如分析(在Contour中)和搭建,在操作菜单外部显示以便于快速访问。