注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

左查找合并

支持于: 流式处理

将两个数据集合并,保留左表中的所有行以及右表中匹配的行。

变换类别: 合并

声明的参数

  • 选择左边列的条件 - 将测试左边输入模式中的所有列是否符合此条件。如果符合,该列将被选中并输出。
    ColumnPredicate
  • 选择右边列的条件 - 将测试右边输入模式中的所有列是否符合此条件。如果符合,该列将被选中并输出。
    ColumnPredicate
  • 合并条件 - 从左和右输入中列出的列来进行合并。
    List<Tuple<Column<Boolean | Byte | Date | Double | Float | Integer | Long | Short | 字符串 | Timestamp>, Column<Boolean | Byte | Date | Double | Float | Integer | Long | Short | 字符串 | Timestamp>>>
  • 左数据集 - 合并中使用的左数据集。
    Table
  • 右数据集 - 合并中使用的右数据集。
    Table
  • 非必填 右边列的前缀 - 为右侧所有列添加的前缀。
    Literal<字符串>

示例

示例 1: 基本情况

参数值:

  • 选择左边列的条件:
    columnNameIsIn(
     columnNames: [tail_number, airline],
    )
  • 选择右边列的条件:
    columnNameIsIn(
     columnNames: [home_airport],
    )
  • 合并条件: [(tail_number, tail_number)]
  • 左数据集: ri.foundry.main.dataset.left
  • 右数据集: ri.foundry.main.dataset.right
  • 右边列的前缀: null

输入: ri.foundry.main.dataset.left

tail_numberairlinemilesfactor
XB-123foundry air1242
MT-222new airline11235
XB-123foundry airline3355
MT-222new air5654
KK-452new air2221
PA-452new air2122
XB-123foundry airline11342

ri.foundry.main.dataset.right

tail_numberhome_airport
XB-123LHR
MT-222CPH
KK-452JFK
JR-201IAD

输出:

tail_numberairlinehome_airport
XB-123foundry airLHR
MT-222new airlineCPH
XB-123foundry airlineLHR
MT-222new airCPH
KK-452new airJFK
PA-452new airnull
XB-123foundry airlineLHR

示例 2: 基本情况

参数值:

  • 选择左边列的条件:
    columnNameIsIn(
     columnNames: [tail_number, airline, factor],
    )
  • 选择右边列的条件:
    columnNameIsIn(
     columnNames: [home_airport],
    )
  • 合并条件: [(tail_number, tail_number), (factor, factor)]
  • 左数据集: ri.foundry.main.dataset.left
  • 右数据集: ri.foundry.main.dataset.right
  • 右边列的前缀: null

输入: ri.foundry.main.dataset.left

tail_numberairlinemilesfactor
XB-123foundry air1242
MT-222new airline11235
XB-123foundry airline3355
MT-222new air5654
KK-452new air2221
PA-452new air2122
XB-123foundry airline11342

ri.foundry.main.dataset.right

tail_numberhome_airportfactor
XB-123LHR2
MT-222CPH1
KK-452JFK10
JR-201IAD4

输出:

tail_numberairlinefactorhome_airport
XB-123foundry air2LHR
MT-222new airline5null
XB-123foundry airline5null
MT-222new air4null
KK-452new air1null
PA-452new air2null
XB-123foundry airline2LHR

示例 3: 基本情况

参数值:

  • 选择左边列的条件:
    allColumns(

    )
  • 选择右边列的条件:
    columnNameIsIn(
     columnNames: [home_airport],
    )
  • 合并条件: [(tail_number, tail_number)]
  • 左数据集: ri.foundry.main.dataset.left
  • 右数据集: ri.foundry.main.dataset.right
  • 右边列的前缀: null

输入: ri.foundry.main.dataset.left

tail_numberairlinemilesfactor
XB-123foundry air1242
MT-222new airline11235
XB-123foundry airline3355
MT-222new air5654
KK-452new air2221
PA-452new air2122
XB-123foundry airline11342

ri.foundry.main.dataset.right

tail_numberhome_airport
XB-123LHR
XB-123LGW
MT-222CPH
KK-452JFK
JR-201IAD

输出:

tail_numberairlinemilesfactorhome_airport
XB-123foundry air1242LHR
XB-123foundry air1242LGW
MT-222new airline11235CPH
XB-123foundry airline3355LHR
XB-123foundry airline3355LGW
MT-222new air5654CPH
KK-452new air2221JFK
PA-452new air2122null
XB-123foundry airline11342LHR
XB-123foundry airline11342LGW