注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

保留重复项

支持于: 批处理

从输入中保留重复行。

变换类别: 其他

声明的参数

  • 列子集 - 如果指定了任何列,仅在确定唯一性时使用这些列。
    Set<Column<AnyType>>
  • 数据集 - 要保留重复行的数据集。
    Table

示例

示例 1: 基本情况

参数值:

  • 列子集: {tail_number}
  • 数据集: ri.foundry.main.dataset.aggregate

输入:

tail_numberairlinemilesfactor
XB-123foundry air1242
MT-222new airline11235
XB-123foundry airline3355
MT-222new air5654
KK-452new air2221
XB-123foundry airline11343

输出:

tail_numberairlinemilesfactor
XB-123foundry air1242
MT-222new airline11235
XB-123foundry airline3355
MT-222new air5654
XB-123foundry airline11343

示例 2: 基本情况

描述: 无子集查找精确重复项。 参数值:

  • 列子集: {}
  • 数据集: ri.foundry.main.dataset.aggregate

输入:

tail_numberairlinemilesfactor
XB-123foundry air1242
XB-123foundry air1242
XB-123foundry air1242
MT-222new airline11236
MT-222new airline11235

输出:

tail_numberairlinemilesfactor
XB-123foundry air1242
XB-123foundry air1242
XB-123foundry air1242

示例 3: 空值情况

参数值:

  • 列子集: {tail_number}
  • 数据集: ri.foundry.main.dataset.aggregate

输入:

tail_numberairlinemilesfactor
nullfoundry air1242
nullnew airline11235
nullfoundry airline3355
MT-222new air5654
KK-452new air2221
XB-123foundry airline11343

输出:

tail_numberairlinemilesfactor
nullfoundry air1242
nullnew airline11235
nullfoundry airline3355