注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
每个数据集选择器可以配置为选择或排除与选择器中条件匹配的数据集。例如,选择派生数据集将缩小渠道以仅包含派生数据集。排除文件夹/palantir/finance中的数据集将通过不包含给定文件夹中的数据集来缩小渠道。
一些数据集选择器还包括第二个参数,例如要在策略中包含或排除的文件夹或工作类型的列表。
以下列表描述了在配置保留策略时可用于保留应用程序的事务选择器。
通过给定的RID选择所有数据集。请注意,即使您重命名数据集,数据集的RID也不会更改。
需要1个参数: 数据集列表(由其RID保存的数据集列表)。
选择以下数据集:<数据集列表>

选择给定文件夹或项目中所有通过其RID识别的数据集。将来在这些文件夹或项目中创建的任何数据集也将受此策略的约束。
需要1个参数: 文件夹列表(由其RID保存的文件夹或项目列表)。
选择以下文件夹中的数据集:<文件夹列表>

一个数据集定义为派生数据集当且仅当以下条件为真:
不满足这些条件的数据集,包括原始数据集、从外部来源摄取的数据集以及从未在主分支上搭建的数据集,将不会被此选择器选择。
以一个可选的worker type列表作为参数: worker type列表是在JobSpec中的workerType字段中指定的一组工作类型(例如,下面图像中的transforms和phonograph2-writeback)。如果此字段为空,此选择器将影响所有派生数据集。
选择具有以下工作类型的派生数据集:transforms,phonograph2-writeback

选择在回收站中的数据集。
不需要参数。
选择在回收站中的数据集

为了展示数据集选择器及其组合使用的方式,请考虑以下两个示例:
以下数据集选择器集合将选择空间中所有未被删除的数据集,除非它们包含在folderA中:
选择空间中的所有数据集排除回收站中的数据集排除以下文件夹中的数据集:folderA
以下数据集选择器集合将选择folderA中的所有数据集,除了增量数据集:
排除以下数据集:增量数据集选择以下文件夹中的数据集:folderA
我们建议使用在以下文件夹中的数据集选择器。
我们建议使用在以下数据集中选择器。