注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
最新的数据对许多 Foundry 工作流至关重要。Ontology 用户可以通过结合来自输入数据源和用户编辑的数据,创建来自 Ontology 的索引数据的物化,其中包含每个 Object 实例的最新状态。
物化的两个主要应用案例是:
我们建议通过创建物化数据集并通过其他 Foundry 数据集的现有下载工作流(如 数据导出 和通过 Foundry 变换 导出)来在 Foundry 中协调批量下载。
通过在 Ontology 管理器的数据源选项卡中切换编辑配置,导航到物化选项卡。在物化选项卡中,您可以根据输入数据源类型创建物化 Object 数据集或 Object 限制视图,并进行多种配置。
在 Object 存储 V1(Phonograph)中,数据输出数据集相当于物化数据集。要启用用户编辑某种 Object 类型或具有连接表的多对多链接类型,在 OSv1 中需要数据输出数据集。
Object 存储 V2 不需要物化数据集来启用用户编辑。相反,用户可以通过在 Ontology 管理器的数据源选项卡中切换编辑配置来启用某种 Object 类型的用户编辑。这使得在 OSv2 中物化是非必填的,用户只需要在上述两个主要应用案例中创建物化。OSv2 还允许创建多个物化数据集,以便用户仅物化某种 Object 类型的部分属性。
OSv1 数据输出数据集与 OSv2 物化数据集之间还有其他行为差异,如下所述。
Object 存储 V1(Phonograph)数据输出数据集和 Object 存储 V2 物化数据集以不同方式处理搭建计划。
数据输出和物化数据集的保留方式不同。
在 OSv1 中,数据输出数据集的行为类似于常规数据集,意味着可以在平台内指定特定的保留策略。这使用户可以在定期搭建数据输出数据集时回顾 Object 类型状态的历史快照。
在 OSv2 中,物化数据集的保留不可自定义。历史事务会被不断删除,仅保证最新快照可用。在这种情况下,如果保留 Object 类型状态的历史快照很重要,用户需要在下游设置变换。
Object 存储 V1(Phonograph)数据输出数据集和 Object 存储 V2 物化数据集与输入数据源架构的关系不同。
__
前缀的列(例如 __is_deleted
, __patch_offset
)在物化数据集中是用于 Foundry 去重目的的元数据列,不代表 Object 类型的任何状态信息。这些列可能在未来版本中被重命名或删除,且不会事先警告,不应在生产工作流中使用。
Object 存储 V1(Phonograph)不允许物化使用限制视图作为输入数据源的 Object 类型的限制视图。用户只能物化包含限制视图输入数据源的支持数据集中所有行的数据输出数据集。然后,用户需负责基于其访问限制正确保障对数据输出数据集的访问。
在 Object 存储 V2 中,用户可以为使用限制视图作为输入数据源的细粒度权限 Object 类型配置常规数据集或限制视图作为物化资源,如下所示。
在拥有多个输入数据源的 Object 类型的情况下,用户可以通过选择他们希望物化数据的输入数据源来配置其物化数据集。如果未选择某个输入数据源,则从该输入数据源映射的 Object 类型属性将不会在物化数据集中反映。如果某些输入数据源是限制视图,用户有两种选择: