注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
Pipeline Builder は、さまざまなレベルで操作する式を提供します。これらは一般的に、行レベル、集計、またはジェネレータに分類されます。
行レベル関数は、単一の行の値に対して操作を行います。たとえば、add 式など、ほとんどの式がこのカテゴリーに属します。
集計関数は、複数の行の値を 1 つに集約します。たとえば、sum 式などです。
ジェネレータ関数は、単一の行から複数の値を生成します。たとえば、explode_array 式などです。
トランスフォームは、全体のテーブルまたは複数のテーブルに対して操作を行う関数です。たとえば、drop トランスフォームなどです。以下のドキュメントでは、利用可能な式とトランスフォームについて説明します。
対応環境: Batch, Streaming
絶対値を返します。
式カテゴリ: Numeric
型変数の境界: T は Numeric を受け入れる
出力型: T
引数値:
numeric_column| numeric_column | 出力 |
|---|---|
| 0.0 | 0.0 |
| 1.1 | 1.1 |
| -1.1 | 1.1 |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
すべての入力列の合計を計算します。
式カテゴリ: Numeric
出力型: Numeric
引数値:
col_a, col_b]| col_a | col_b | 出力 |
|---|---|---|
| 0 | 1 | 1 |
| 3 | -2 | 1 |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
構造体のフィールドを更新するか、新しいフィールドを追加します。
式カテゴリ: Struct
出力型: Struct
引数値:
valuestruct| struct | value | 出力 |
|---|---|---|
| { airline: { id: NA, }, } | 1 | { airline: { id: 1, }, } |
| { airline: { id: FE, }, } | 2 | { airline: { id: 2, }, } |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
'start' から 'value' 日/週/月/四半期/年後の日付を返します。
式カテゴリ: Datetime
出力型: Date
引数値:
DAYS出力: 2022-02-03
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
配列内のすべての要素に対して式が真である場合に真を返します。
式カテゴリ: Array
出力型: Boolean
引数値:
mileselement,| miles | 出力 |
|---|---|
| [ 12300, null ] | false |
| [ null, null ] | true |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
指定されたすべての条件が真である場合に真を返します。null は false として扱われます。
式カテゴリ: Boolean
出力型: Boolean
引数値:
left_boolean, right_boolean]| left_boolean | right_boolean | 出力 |
|---|---|---|
| true | true | true |
| true | false | false |
| false | true | false |
| false | false | false |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
配列内のいずれかの要素に対して式が真である場合に真を返します。
式カテゴリ: Array
出力型: Boolean
引数値:
mileselement,| miles | 出力 |
|---|---|
| [ 12300, null ] | true |
| [ 12300, 12000 ] | false |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
逆余弦関数。
式カテゴリ: Numeric
出力型: Double
引数値:
radians出力: 0.0
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
逆正弦関数。
式カテゴリ: Numeric
出力型: Double
引数値:
radians出力: 0.0
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
逆正接関数。
式カテゴリ: Numeric
出力型: Double
引数値:
degreesangle| angle | 出力 |
|---|---|
| -1.0 | -45.0 |
| 0.0 | 0.0 |
| 1.0 | 45.0 |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
原点から点 (x, y) への光線と正の x 軸との間の角度 θ を返します。-π<θ<=π の範囲に制限されます。
式カテゴリ: Numeric
出力型: Double
引数値:
degreesxy| y | x | 出力 |
|---|---|---|
| 0.0 | 0.0 | 0.0 |
| 1.0 | 0.0 | 90.0 |
| 0.0 | -1.0 | 180.0 |
| -1.0 | 0.0 | -90.0 |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
球体近似を使用してメートル平方でジオメトリの面積を計算します。ラインストリングやポイントの場合、これに等しい値は 0 です。
式カテゴリ: Geospatial
出力型: Double
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
指定したインデックスに値を追加します。
式カテゴリ: Array
型変数の境界: T は AnyType を受け入れる
出力型: Array<T>
引数値:
numbers| numbers | 出力 |
|---|---|
| [ 3, 5 ] | [ 1, 3, 5 ] |
| [ 2 ] | [ 1, 2 ] |
| [ ] | [ 1 ] |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
配列のデカルト積を計算します。
式カテゴリ: Array
出力型: Array<Struct>
引数値:
first, second]| first | second | 出力 |
|---|---|---|
| [ 1, 2 ] | [ 3, 4 ] | [ { first: 1, second: 3, }, { first: 1, *second... |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
指定された配列を重複排除せずに 1 つの配列に連結します。
式カテゴリ: Array
型変数の境界: T は AnyType を受け入れる
出力型: Array<T>
引数値:
出力: [ 1, 2, 3, 4, 5 ]
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
配列が値を含む場合に true を返します。
式カテゴリ: Array, Boolean
出力型: Boolean
引数値:
part_ids| part_ids | 出力 |
|---|---|
| [ AWE-112, BRR-123 ] | true |
| [ AWE-222, ABC-543 ] | false |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
array に null が含まれている場合に true を返します。
式カテゴリ: Array, Boolean
出力型: Boolean
引数値:
part_ids| part_ids | 出力 |
|---|---|
| [ AWE-112, BRR-123, null ] | true |
| [ AWE-222, ABC-543 ] | false |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
left 配列に含まれ、right 配列に含まれないすべてのユニークな要素を返します。
式カテゴリ: Array
型変数の境界: T は AnyType を受け入れる
出力型: Array<T>
引数値:
出力: [ 1 ]
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
重複を削除し、配列からユニークな値を返します。
式カテゴリ: Array
型変数の境界: T は AnyType を受け入れる
出力型: Array<T>
引数値:
出力: [ 1, 2, 3 ]
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
入力配列から指定された位置の要素を返します。配列の外の位置は null を返します。
式カテゴリ: Array
型変数の境界: T は AnyType を受け入れる
出力型: T
引数値:
出力: 10
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
配列の要素がユニークである場合は true を、そうでない場合は false を返します。配列が null の場合、返される値は false です。
式カテゴリ: Array, Boolean
出力型: Boolean
引数値:
part_ids| part_ids | 出力 |
|---|---|
| [ ABC-123, DCE-123, EFG-123 ] | true |
| [ ABC-123, ABC-123, EFG-123 ] | false |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
入力されたネストされた配列から、ネストの最初のレベル内の要素を結合することによって単一の配列を作成します。
式カテゴリ: Array
型変数の境界: T は AnyType を受け入れる
出力型: Array<T>
引数値:
array| array | 出力 |
|---|---|
| [ [ 1, 2, 3 ], [ 4, 5, 6 ] ] | [ 1, 2, 3, 4, 5, 6 ] |
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
重複を削除し、配列のリストを交差させます。
式カテゴリ: Array
型変数の境界: T は AnyType を受け入れる
出力型: Array<T>
引数値:
出力: [ 3 ]
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
配列列の最大値を返します。
式カテゴリ: Array
型変数の境界: T は Numeric を受け入れる
出力型: T
引数値:
出力: 3
詳細はこちらをご覧ください。
対応環境: Batch, Streaming
配列列の最小値を返します。
式カテゴリ: Array
型変数の境界: T は Numeric を受け入れる
**出
サポート対象: Batch
ある基数から別の基数に数値(またはその文字列表現)を変換します。
式カテゴリー: Binary, Cast, Numeric
出力タイプ: String
引数値:
出力: 305153
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
式カテゴリー: Geospatial, Numeric
出力タイプ: Double
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
式カテゴリー: Numeric
出力タイプ: Double
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
式カテゴリー: Datetime
出力タイプ: Double
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
式カテゴリー: Numeric
出力タイプ: Double
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
入力をjson文字列に変換します。
式カテゴリー: File, String
出力タイプ: String
引数値:
struct| struct | 出力 |
|---|---|
| { airline: { id: NA, }, } | {"airline":{"id":"NA"}} |
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
オントロジーGeoPointを通常のGeoPointに変換します。オントロジーGeoPointは'{lat},{lon}'の形式の文字列で、-90 <= lat <= 90 および -180 <= lon <= 180の範囲です。通常のGeoPointは{"longitude": {long},"latitude": {lat}}の形式の構造体です。
式カテゴリー: Geospatial
出力タイプ: GeoPoint
引数値:
geopoint| geopoint | 出力 |
|---|---|
| -20.0000000,80.0000000 | { latitude: -20.0, longitude: 80.0, } |
| 38.9031000,-77.0599000 | { latitude: 38.9031, longitude: -77.0599, } |
| 41.9876543,-99.1234568 | { latitude: 41.9876543, longitude: -99.1234568, } |
詳細はこちらをご覧ください。
サポート対象: Batch
hexの逆。各文字ペアを16進数として解釈し、その数値のバイト表現に変換します。
式カテゴリー: Numeric, String
出力タイプ: Binary
引数値:
string_hex| string_hex | 出力 |
|---|---|
| 68656C6C6F | aGVsbG8= |
| 3039 | MDk= |
| FFFFFFFFFFFFCFC7 | ////////z8c= |
| 4C6F6E646F6E | TG9uZG9u |
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
hexの逆。各文字ペアを16進数として解釈し、その数値のバイト表現をutf-8文字列に変換します。
式カテゴリー: String
出力タイプ: String
引数値:
string_hex| string_hex | 出力 |
|---|---|
| 68656C6C6F | hello |
| 4C6F6E646F6E | London |
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
ジオセントリック直交座標をジオデシック極座標に変換します。高度は楕円体上の高さとして定義されます。任意の座標がnullである場合、出力もnullになります。
式カテゴリー: Geospatial
出力タイプ: GeoPoint with altitude
引数値:
x_coordinatey_coordinatez_coordinate| x_coordinate | y_coordinate | z_coordinate | 出力 |
|---|---|---|---|
| 0.0 | 6378137.0 | 0.0 | { altitude -> 0.0, geoPoint -> { latitude -> 0.0, longitude -> 90.0, }, } |
| 0.0 | -6378137.0 | 0.0 | { altitude -> 0.0, geoPoint -> { latitude -> 0.0, longitude -> -90.0, }, } |
| -6378137.0 | 0.0 | 0.0 | { altitude -> 0.0, geoPoint -> { latitude -> 0.0, longitude -> 180.0, }, } |
| -6378137.0 | -0.0 | 0.0 | { altitude -> 0.0, geoPoint -> { latitude -> 0.0, longitude -> -180.0, }, } |
| 0.0 | 0.0 | 6356752.314245179 | { altitude -> 0.0, geoPoint -> { latitude -> 90.0, longitude -> 0.0, }, } |
| 0.0 | 0.0 | -6356752.314245179 | { altitude -> 0.0, geoPoint -> { latitude -> -90.0, longitude -> 0.0, }, } |
詳細はこちらをご覧ください。
サポート対象: Batch
レガシーOffsetDateTime列をすべてのFoundryパイプラインで使用できるタイムスタンプに変換します。このタイムスタンプはUTCで返されます。
式カテゴリー: Datetime
出力タイプ: Timestamp
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
LineStringジオメトリをPolygonジオメトリに変換します。この式はLineStringジオメトリが閉じていると仮定します。閉じていない場合、式はnullを返します。
式カテゴリー: Geospatial
出力タイプ: Geometry
引数値:
polygon_points| polygon_points | 出力 |
|---|---|
| {"type":"LineString","coordinates":[[-77.49,38.01],[-77.47,38.15],[-77.19,38.14],[-77.49,38.01]]} | {"type":"Polygon","coordinates":[[[-77.49,38.01],[-77.47,38.15],[-77.19,38.14],[-77.49,38.01]]]} |
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
UTCから指定されたタイムゾーンにタイムスタンプを変換します。
式カテゴリー: Datetime
出力タイプ: Timestamp
引数値:
出力: 2020-04-28T05:09:00Z
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
指定されたタイムゾーンに基づいてタイムスタンプをUTCに変換します。
式カテゴリー: Datetime
出力タイプ: Timestamp
引数値:
出力: 2020-04-28T15:09:00Z
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
GeoPointをgeo-indexed列(Geohash型の列)に対応するオントロジーGeoPointの文字列に変換します。オントロジーGeoPointは'{lat},{lon}'の形式の文字列で、-90 <= lat <= 90 および -180 <= lon <= 180の範囲です。
式カテゴリー: Geospatial
出力タイプ: Ontology GeoPoint
引数値:
point| point | 出力 |
|---|---|
| { latitude: -20.0, longitude: 80.0, } | -20.0000000,80.0000000 |
| { latitude: 38.9031, longitude: -77.0599, } | 38.9031000,-77.0599000 |
| { latitude: 41.987654321, longitude: -99.123456789, } | 41.9876543,-99.1234568 |
| null | null |
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
指定された式の16進数値を計算します。
式カテゴリー: Numeric, String
出力タイプ: String
引数値:
city_hex| city_hex | 出力 |
|---|---|
| TG9uZG9u | 4C6F6E646F6E |
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
指定された式の8進数値を計算します。
式カテゴリー: Numeric
出力タイプ: String
引数値:
出力: 30071
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
角度のコサインを取ります。
式カテゴリー: Numeric
出力タイプ: Double
引数値:
degreesangle| angle | 出力 |
|---|---|
| 0.0 | 1.0 |
| 90.0 | 0.0 |
| 180.0 | -1.0 |
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
ソース座標系からの座標ペアを取り、それらをWGS 84の緯度/経度値に変換します。座標系(座標リファレンスシステムまたは空間リファレンスシステムとしても知られる)は、地球上の点の位置を識別するための異なるシステムを表し、EPSGなどの標準化されたデータベースのキーで識別されることがよくあります。指定された投影がサポートされていない場合や、どちらかの座標がnullである場合はnullを返します。
式カテゴリー: Geospatial
出力タイプ: GeoPoint
引数値:
x_coordinatey_coordinate| x_coordinate | y_coordinate | 出力 |
|---|---|---|
| 322190.2233952965 | 4306505.703879281 | { latitude -> 38.88944258, longitude -> -77.05014581, } |
| 323243.1361536059 | 4318298.06539618 | { latitude -> 38.99585379643137, longitude -> -77.04105678275415, } |
| 407063.63465300016 | 4764873.719585404 | { latitude -> 43.03086518778498, longitude -> -76.14077251822197, } |
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
指定されたタイプの空の配列を返します。
式カテゴリー: Array
型変数の境界: T accepts AnyType
出力タイプ: Array<T>
引数値:
出力: [ ]
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
提供された列から配列を作成します。
式カテゴリー: Array
型変数の境界: T accepts AnyType
出力タイプ: Array<T>
引数値:
出力: [ 1, 2, 3 ]
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
指定されたジオ座標を中心に楕円をポリゴンとして近似します。点間の距離は、地球の表面を近似するWGS84楕円体に沿って計算されます。
式カテゴリー: Geospatial
出力タイプ: Geometry
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
2点間にジオデシックラインを作成します。
式カテゴリー: Geospatial
出力タイプ: Geometry
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
指定された点からGeoJSON LineStringジオメトリを作成します。
式カテゴリー: Geospatial
型変数の境界: T accepts Struct<longitude, latitude>
出力タイプ: Geometry
引数値:
points| points | 出力 | |
引数の値:
geometries| geometries | 出力 |
|---|---|
| [ {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]}, {"type":"Polygon","coordinates":[[[0.5,0.0],[1.5,0.0],[1.5,1.0],[0.5,1.0],[0.5,0.0]]]} ] | {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[0.5,1.0],[1.0,1.0],[1.5,1.0],[1.5,0.0],[1.0,0.0],[0.5,0.0],[0.0,0.0]]]} |
| [ ] | null |
| null | null |
詳細は こちら を参照してください。
対応環境: バッチ、ストリーミング
geometry の配列を与えると、これらを線状の geometry に結合します。Dissolve は、不要なノードを削除し、結合できるラインストリングを連結することで、入力セットのラインストリングを簡素化します。Z 座標は dissolve 操作の目的では無視されますが、結果の geometry の頂点は入力の対応するポイントと同じ z 座標を持ちます。
式のカテゴリー: Geospatial
型変数の制約: T は Geometry を受け入れます
出力型: T
引数の値:
geometries| geometries | 出力 |
|---|---|
| [ {"type":"LineString","coordinates":[[0,0],[0,1],[1,1]]}, {"type":"LineString","coordinates":[[1,1]... | {"type":"MultiLineString","coordinates":[[[5.0, 5.0],[4.0, 4.0],[3.0, 3.0],[2.0, 2.0],[1.0, 1.0],[0.0, 1.0],[0.0, 0.0]],[[7.0, 7.0], [6.0, 7.0], [6.0, 6.0]]]} |
| [ {"type":"LineString","coordinates":[[0,0,1],[0,1,1],[1,1,1]]}, {"type":"LineString","coordinates":[[1,1,1],[2,2,2]]}, {"type":"LineString","coordinates":[[1,1,2],[2,2,2],[3,3,3]]} ] | {"type":"LineString","coordinates":[[0.0, 0.0, 1.0],[0.0, 1.0, 1.0],[1.0, 1.0, 1.0],[2.0, 2.0, 2.0],[3.0, 3.0, 3.0]]} |
詳細は こちら を参照してください。
対応環境: バッチ、ストリーミング
geometry のバッファを正および負のバッファ距離の両方に対して計算します。この幾何学的オブジェクトの距離内のすべてのポイント(または負のバッファの場合は境界のバッファ距離内のポイントを除く)をおおよそ表します。バッファは z 座標を削除し、ラインやポイントのゼロ/負の距離バッファは null を返します。
式のカテゴリー: Geospatial
出力型: Geometry
引数の値:
distancegeometryROUNDROUNDDOUBLE_SIDED| geometry | distance | 出力 |
|---|---|---|
| {"type":"Point","coordinates":[-77.07368071728229,38.83040844313318]} | 10.0 | {"type":"Polygon","coordinates":[[[-77.07356558299462, 38.83041048767274],[-77.07356728534256, 38.83... |
| {"type":"LineString","coordinates":[[-77.07368071728229,38.83040844313318, 1],[-77.0725293738795,38.83042888342659, 1]]} | 10.0 | {"type":"Polygon","coordinates":[[[-77.07253198637027, 38.83051894052714],[-77.07250947453703, 38.83... |
| {"type":"Polygon","coordinates":[[[-77.07368071728229,38.83040844313318, 1],[-77.0725293738795,38.83... | 10.0 | {"type":"Polygon","coordinates":[[[-77.07379585155829, 38.83040639848026],[-77.07382199292853, 38.83... |
詳細は こちら を参照してください。
対応環境: バッチ、ストリーミング
地球の球面近似を使用して、geometry の重心、または「質量の中心」を返します。geometry が異なる次元のコレクションである場合、最も高い次元の要素のみが重心に寄与します(たとえば、ポイント、ライン、およびポリゴンのコレクションでは、ポイントとラインは無視されます)。
式のカテゴリー: Geospatial
出力型: GeoPoint
詳細は こちら を参照してください。
対応環境: バッチ、ストリーミング
geometry a が geometry b を含むかどうかを判定します。ポリゴンの境界上にあるポイントやラインは、他の geometry 内に含まれません。
式のカテゴリー: Geospatial
出力型: Boolean
引数の値:
geometry_ageometry_b| geometry_a | geometry_b | 出力 |
|---|---|---|
| {"coordinates":[[[-112.94377956164206,34.81725414459382],[-112.94377956164206,30.006795384733323], [... | {"type":"Point","coordinates":[-100.0,32.0]} | true |
| {"coordinates":[[[-112.94377956164206,34.81725414459382],[-112.94377956164206,30.006795384733323], [... | {"type":"LineString","coordinates":[[-112.94377956164206,34.81725414459382],[-112.94377956164206,30.006795384733323]]} | false |
| {"type":"LineString","coordinates":[[-112.94377956164206,34.81725414459382],[-112.94377956164206,30.006795384733323]]} | {"type":"Point","coordinates":[-112.94377956164206,34.81725414459382]} | false |
| {"type":"Point","coordinates":[-112.94377956164206,34.81725414459382]} | {"type":"Point","coordinates":[-112.94377956164206,34.81725414459382]} | true |
| {"coordinates":[[[-112.94377956164206,34.81725414459382],[-112.94377956164206,30.006795384733323], [... | {"coordinates":[[[-111.94377956164206,33.81725414459382],[-111.94377956164206,31.006795384733323], [... | true |
詳細は こちら を参照してください。
対応環境: バッチ、ストリーミング
geometry a と geometry b が交差しない部分を計算します。
式のカテゴリー: Geospatial
出力型: Geometry
引数の値:
geometry_ageometry_b| geometry_a | geometry_b | 出力 |
|---|---|---|
| {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} | {"type":"Polygon","coordinates":[[[0.25,0.25],[0.5,0.25],[0.5,0.5],[0.25,0.5],[0.25,0.25]]]} | {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]],[[0.25,0.25],[0.5,0.25],[0.5,0.5],[0.25,0.5],[0.25,0.25]]]} |
| {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} | {"type":"Polygon","coordinates":[[[0.0,0.0],[0.5,0.0],[0.5,1.0],[0.0,1.0],[0.0,0.0]]]} | {"type":"Polygon","coordinates":[[[0.5,1.0],[1.0,1.0],[1.0,0.0],[0.5,0.0],[0.5,1.0]]]} |
| {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} | {"type":"Polygon","coordinates":[[[5.0,5.0],[5.0,6.0],[6.0,6.0],[6.0,5.0],[5.0,5.0]]]} | {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} |
| {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} | {"type":"LineString","coordinates":[[0.0,0.0],[0.0,1.0]]} | {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} |
詳細は こちら を参照してください。
対応環境: バッチ、ストリーミング
geometry をその構成要素である単純 geometry の配列に変換します。
式のカテゴリー: Geospatial
出力型: Array<Geometry>
引数の値:
geometry| geometry | 出力 |
|---|---|
| {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} | [ {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} ] |
| {"type":"MultiPolygon","coordinates":[[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]],[[[5.0,5.0],[5.0,6.0],[6.0,6.0],[6.0,5.0],[5.0,5.0]]]]} | [ {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]}, {"type":"Polygon","coordinates":[[[5.0,5.0],[5.0,6.0],[6.0,6.0],[6.0,5.0],[5.0,5.0]]]} ] |
詳細は こちら を参照してください。
対応環境: バッチ、ストリーミング
geometry a と geometry b が交差する部分を計算します。
式のカテゴリー: Geospatial
出力型: Geometry
引数の値:
geometry_ageometry_b| geometry_a | geometry_b | 出力 |
|---|---|---|
| {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} | {"type":"Polygon","coordinates":[[[0.5,0.0],[1.5,0.0],[1.5,1.0],[0.5,1.0],[0.5,0.0]]]} | {"type":"Polygon","coordinates":[[[0.5,1.0],[1.0,1.0],[1.0,0.0],[0.5,0.0],[0.5,1.0]]]} |
| {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} | {"type":"Polygon","coordinates":[[[5.0,5.0],[5.0,6.0],[6.0,6.0],[6.0,5.0],[5.0,5.0]]]} | {"type":"Polygon","coordinates":[[]]} |
| {"type":"Polygon","coordinates":[[[0.0,0.0],[0.0,1.0],[1.0,1.0],[1.0,0.0],[0.0,0.0]]]} | {"type":"Polygon","coordinates":[[[1.0,0.0],[1.0,1.0],[2.0,1.0],[2.0,0.0],[1.0,0.0]]]} | {"type":"LineString","coordinates":[[1.0,1.0],[1.0,0.0]]} |
| {"type":"Point","coordinates":[0.0,0.0]} | {"type":"LineString","coordinates":[[0.0,0.0],[1.0,0.0]]} | {"type":"Point","coordinates":[0.0,0.0]} |
| {"type":"LineString","coordinates":[[0.0,0.0],[1.0,0.0]]} | {"type":"Polygon","coordinates":[[[2.0,0.0],[2.0,1.0],[3.0,1.0],[3.0,0.0],[2.0,0.0]]]} | {"type":"LineString","coordinates":[]} |
詳細は こちら を参照してください。
対応環境: バッチ、ストリーミング
geometry のラインストリングおよびマルチラインストリングの長さをメートル単位で取得します。地球の球面近似を使用します。非線形 geometry (ポリゴンやポイント) は 0 と見なされます。
式のカテゴリー: Geospatial
出力型: Double
引数の値:
geometry| geometry | 出力 |
|---|---|
| {"type":"LineString","coordinates":[[-73.778128,40.641195],[-118.408535,33.941563]]} | 3974344.7433354934 |
| {"type":"LineString","coordinates":[[0.0,0.0],[1.0,0.0],[1.0,1.0],[1.0,2.0]]} | 333585.2407005987 |
| {"type":"MultiLineString","coordinates":[[[0.0,0.0],[1.0,0.0 |
引数の値:
h3| h3 | 出力 |
|---|---|
| 862a1072fffffff | true |
| not an h3 value | false |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
入力が有効な MGRS (軍用グリッド参照システム) 文字列である場合に true を返します。
式カテゴリー: 地理空間
出力タイプ: Boolean
引数の値:
mgrs| mgrs | 出力 |
|---|---|
| 4Q FJ 1 6 | true |
| 4Q FJ 12345 67890 | true |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
入力が有効な MIME タイプである場合に true を返します。
式カテゴリー: Boolean、その他
出力タイプ: Boolean
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
入力が有効なオントロジー GeoPoint である場合に true を返します。オントロジー GeoPoint は '{lat},{lon}' の形式で、-90 <= lat <= 90 および -180 <= lon <= 180 の範囲です。
式カテゴリー: 地理空間
出力タイプ: Boolean
引数の値:
geopoint| geopoint | 出力 |
|---|---|
| -35.307428203,149.122686883 | true |
| 149.122686883,-35.307428203 | false |
| 10.0, 20.0 | true |
| 10.0, 20.0 | true |
| not a GeoPoint | false |
| null | false |
| (10.0,20.0) | false |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
入力が有効な Gotham の委任メディア gid である場合に true を返します。詳細については Gotham の委任メディア rtfm を確認してください。
式カテゴリー: Boolean
出力タイプ: Boolean
引数の値:
出力: true
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
入力が有効な Foundry メディアリファレンスである場合に true を返します。
式カテゴリー: Boolean
出力タイプ: Boolean
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
入力が有効な Foundry リソース識別子である場合に true を返します。
式カテゴリー: Boolean
出力タイプ: Boolean
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
入力が有効な uuid である場合に true を返します。
式カテゴリー: Boolean
出力タイプ: Boolean
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
指定された区切り文字で配列を結合します。
式カテゴリー: 配列
出力タイプ: String
引数の値:
出力: hello-world
詳細はこちらをご覧ください。
サポート対象: バッチ
週/月/四半期/年の最後の日を返します。
式カテゴリー: 日時
出力タイプ: Date
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
null 値を無視して、すべての入力列の中で最小値を計算します。
式カテゴリー: Boolean、数値
型変数の制約: T は ComparableType を受け入れます
出力タイプ: T
引数の値:
a, b, c]| a | b | c | 出力 |
|---|---|---|---|
| 1 | 2 | 3 | 1 |
| 1 | 3 | 2 | 1 |
| 3 | 2 | 1 | 1 |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
インデックスに基づいて文字列の左側を抽出します。
式カテゴリー: 文字列
出力タイプ: String
引数の値:
出力: Hello
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
文字列列の左側を指定された長さまでパディングします。
式カテゴリー: 文字列
出力タイプ: String
引数の値:
出力: ***Hello world!
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
文字列列または配列列の各値の長さを返します。
式カテゴリー: 配列、数値
出力タイプ: Integer
引数の値:
string| string | 出力 |
|---|---|
| hello | 5 |
| bye | 3 |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
左が右より小さい場合に true を返します。
式カテゴリー: Boolean
出力タイプ: Boolean
引数の値:
leftright| left | right | 出力 |
|---|---|---|
| 1.0 | 10 | true |
| 10.0 | 1 | false |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
左が右以下の場合に true を返します。
式カテゴリー: Boolean
出力タイプ: Boolean
引数の値:
ab| a | b | 出力 |
|---|---|---|
| 1 | 0 | false |
| 1 | 1 | true |
| 0 | 1 | true |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
2 つの文字列間のレーベンシュタイン距離を計算します。
式カテゴリー: 距離測定、文字列
出力タイプ: Integer
引数の値:
leftright| left | right | 出力 |
|---|---|---|
| hello | hello | 0 |
| hallo | hello | 1 |
| hello | hEllO | 2 |
| hello | hello, world! | 8 |
| hello | farewell | 6 |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
列の自然対数 ln(x) を計算します。
式カテゴリー: 数値
出力タイプ: Double
引数の値:
出力: 2.3148100626166146
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
指定された基数で対数を計算します。
式カテゴリー: 数値
出力タイプ: Double
引数の値:
出力: 3.0
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
指定された論理型に式をキャストします。通常のキャスト式とは異なり、この式はデータの基底表現を変更せず、指定された論理型に関連する制約を強制します。これにより、出力を特定の論理型のインスタンスを必要とする下流の式の入力として使用できます。
式カテゴリー: キャスト
型変数の制約: C は AnyType を受け入れます
出力タイプ: C
説明: 自然数への成功したキャスト 引数の値:
出力: 1234
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
文字列内のすべての文字を小文字に変換します。
式カテゴリー: 文字列
出力タイプ: String
引数の値:
出力: hello world
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
列内の値のセットを新しい値にマッピングします。
式カテゴリー: データ準備
型変数の制約: T1 は ComparableType を受け入れます**T2 は AnyType を受け入れます
出力タイプ: T2
引数の値:
country| country | 出力 |
|---|---|
| United Kingdom | UK |
| Denmark | DNK |
| United States of America | null |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
式の剰余を返します。
式カテゴリー: 数値
出力タイプ: DefiniteNumeric
引数の値:
出力: 2.123
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
すべての入力列の積を計算します。
式カテゴリー: 数値
出力タイプ: Numeric
引数の値:
col_a, col_b, col_c]| col_a | col_b | col_c | 出力 |
|---|---|---|---|
| 10 | 2 | 3 | 60 |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
式カテゴリー: 数値
出力タイプ: Numeric
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
平均がゼロで分散が単位の正規分布乱数の列を返します。これは決定論的ではなく、シードを使用しても再ビルド時に同じ結果を生成しません。
式カテゴリー: 数値
出力タイプ: Double
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
Boolean 式の否定された Boolean 値を返します。
式カテゴリー: Boolean
出力タイプ: Boolean
引数の値:
boolean| boolean | 出力 |
|---|---|
| true | false |
| false | true |
詳細はこちらをご覧ください。
サポート対象: バッチ、ストリーミング
ジオメトリ内の単一ポリゴンの N 番目のリングを返します。インデックスは 1 から始まり、インデックスが 0 の場合は範囲外です。インデックスが 1 の場合は外部リングを返します。インデックスが 1 を超える場合は内部リングを返します。以下のいずれかの条件が満たされた場合は null を返します: ジオメトリが単一ポリゴンではない、フィーチャコレクションまたはジオメトリコレクションが提供された、インデックスが範囲外、または少なくとも 1 つの引数が null です。
式カテゴリー: 地理空間
出力タイプ: Geometry
引数の値:
npolygon| polygon | n | 出力 |
|---|---|---|
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 1 | {"coordinates": [[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]], "type": "LineString"} |
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 2 | null |
| {"coordinates":[[[60.0,60.0],[50.0,60.0],[50.0,50.0],[60.0,50.0],[60.0,60.0]],[[57.0,57.0],[55.0,52.0],[52.0,52.0],[50.0,57.0],[57.0,57.0]]],"type":"Polygon"} | 1 | {"coordinates": [[60.0,60.0],[50.0,60.0],[50.0,50.0],[60.0,50.0],[60.0,60.0]], "type": "LineString"} |
| {"coordinates":[[[60.0,60.0],[50.0,60.0],[50.0,50.0],[60.0, |
引数の値:
GeometryTolerance| Geometry | Tolerance | Output |
|---|---|---|
| {"type":"LineString","coordinates":[[30.0,0.0],[35.0,0.0],[40.0,0.0]]} | 1000 | {"type":"LineString","coordinates":[[30.0,0.0],[40.0,0.0]]} |
| {"type":"Polygon","coordinates":[[[-1.0,-1.0],[1.0,-1.0],[1.0,1.0],[0.0,1.0],[-1.0,1.0],[-1.0,-1.0]]]} | 12000 | {"type":"Polygon","coordinates":[[[-1.0,1.0],[1.0,1.0],[1.0,-1.0],[-1.0,-1.0],[-1.0,1.0]]]} |
| {"type":"MultiLineString","coordinates":[[[0.0,0.0],[5.0,0.1],[10.0,0.0]], [[0.0,-5.0],[5.0,0.1],[10.0,5.0]]]} | 12000 | {"type":"MultiLineString","coordinates":[[[0.0,0.0],[10.0,0.0]],[[0.0,-5.0],[10.0,5.0]]]} |
| {"type":"MultiPolygon","coordinates":[[[[-2.0,-2.0],[2.0,-2.0],[2.0,2.0],[0.0,2.1],[-2.0,2.0],[-2.0,... | 12000 | {"type":"MultiPolygon","coordinates":[[[[-2.0,2.0],[2.0,2.0],[2.0,-2.0],[-2.0,-2.0],[-2.0,2.0]], [[1... |
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
角度のサインを求めます。
式のカテゴリー: Numeric
出力タイプ: Double
引数の値:
degreesangle| angle | Output |
|---|---|
| 0.0 | 0.0 |
| 90.0 | 1.0 |
| 180.0 | 0.0 |
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
バイナリー列内の指定されたバイト数をスキップします。
式のカテゴリー: Binary
出力タイプ: Binary
引数の値:
Output: aQ==
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
配列を最初の位置から2番目の位置までスライスして返します。最初の位置は 1 以上でなければなりません。2 番目の位置が配列より長い場合、配列の残りのすべてが返されます。
式のカテゴリー: Array
タイプ変数の制約: T は AnyType を受け入れます
出力タイプ: Array<T>
詳細は こちら をご覧ください。
使用可能範囲: Batch
単語のSoundexエンコーディング(音声表現)を計算します。
式のカテゴリー: String
出力タイプ: String
引数の値:
input_string| input_string | Output |
|---|---|
| cat | C300 |
| caat | C300 |
| two | T000 |
| too | T000 |
| to | T000 |
| four | F600 |
| for | F600 |
| fore | F600 |
| fur | F600 |
| meow | M000 |
| me ow | M000 |
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
指定された正規表現パターンで文字列を分割します。
式のカテゴリー: String
出力タイプ: Array<String>
引数の値:
string| string | Output |
|---|---|
| hello | [ hello ] |
| hello world | [ hello, world ] |
| hello there world | [ hello, there world ] |
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
列の平方根を計算します。
式のカテゴリー: Numeric
出力タイプ: Double
引数の値:
Output: 3.0
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
式のカテゴリー: Boolean, String
出力タイプ: Boolean
引数の値:
Output: true
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
最初の区切り文字の後の文字列を抽出します。一致が見つからない場合は完全な文字列を返します。
式のカテゴリー: String
出力タイプ: String
引数の値:
Output: world
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
最初の区切り文字の前の文字列を抽出します。一致が見つからない場合は完全な文字列を返します。
式のカテゴリー: String
出力タイプ: String
引数の値:
Output: ...
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
式のカテゴリー: Boolean, String
出力タイプ: Boolean
引数の値:
Output: true
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
サブストリングを抽出します。
式のカテゴリー: Numeric
出力タイプ: String
引数の値:
stringstartlength| string | start | length | Output |
|---|---|---|---|
| hello, world | 1 | 5 | hello |
| hello, world | 8 | 5 | world |
| hello, world | -5 | 5 | world |
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
数値とすべての入力列の差を計算します。
式のカテゴリー: Numeric
出力タイプ: Numeric
引数の値:
col_b, col_c]col_a| col_a | col_b | col_c | Output |
|---|---|---|---|
| 5 | 3 | 2 | 0 |
| 2 | 4 | 0 | -2 |
| -2 | -4 | -2 | 4 |
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
ある数値から別の数値を引きます。
式のカテゴリー: Numeric
出力タイプ: Numeric
引数の値:
col_acol_b| col_a | col_b | Output |
|---|---|---|
| 32 | 4 | 28 |
| -5 | -3 | -2 |
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
指定された時間単位での差を返します。
式のカテゴリー: Datetime
出力タイプ: Long
引数の値:
HOURSOutput: 1
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
指定された日数/週数/月数/四半期/年数前の日付を返します。
式のカテゴリー: Datetime
出力タイプ: Date
引数の値:
DAYSOutput: 2022-04-03
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
配列内の要素を合計します。
式のカテゴリー: Array
タイプ変数の制約: T は DefiniteNumeric を受け入れます
出力タイプ: T
引数の値:
Output: 6
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
角度のタンジェントを求めます。
式のカテゴリー: Numeric
出力タイプ: Double
引数の値:
degreesangle| angle | Output |
|---|---|
| 0.0 | 0.0 |
| 90.0 | 1.633123935319537E16 |
| 180.0 | 0.0 |
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
スライディングウィンドウセグメンテーションを使用して一連のテキストセグメントを抽出します。
式のカテゴリー: String
出力タイプ: Array<String>
詳細は こちら をご覧ください。
使用可能範囲: Batch
テキストをエンベディングに変換します。
式のカテゴリー: String
出力タイプ: Embedded vector
Description: 'palantir' という単語の例のエンベディング。 引数の値:
text| text | Output |
|---|---|
| palantir | [ -0.019182289, -0.02127992, 0.009529043, -0.008066221, -0.0014429842, 0.019154688, -0.023556953, -0... |
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
指定された単位でタイムスタンプに値を追加します。
式のカテゴリー: Datetime
出力タイプ: Timestamp
引数の値:
MILLISECONDSOutput: 2022-02-01T00:00:00.002Z
詳細は こちら をご覧ください。
使用可能範囲: Batch
開始から終了までの範囲のタイムスタンプを含む配列を作成します。
式のカテゴリー: Datetime
出力タイプ: Array<Timestamp>
引数の値:
end_timestart_timeDAYS| start_time | end_time | Output |
|---|---|---|
| 2023-01-01T00:00:00Z | 2023-01-03T00:00:00Z | [ 2023-01-01T00:00:00Z, 2023-01-02T00:00:00Z, 2023-01-03T00:00:00Z ] |
| 2023-01-01T01:50:00Z | 2023-01-03T00:00:00Z | [ 2023-01-01T01:50:00Z, 2023-01-02T01:50:00Z ] |
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
指定された単位でタイムスタンプから値を引きます。
式のカテゴリー: Datetime
出力タイプ: Timestamp
引数の値:
MILLISECONDSOutput: 2022-02-01T23:59:59.998Z
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
UTCのタイムスタンプをエポックミリ秒に変換します。
式のカテゴリー: Cast, Datetime
出力タイプ: Long
引数の値:
Output: 1664614800000
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
UTCのタイムスタンプをエポック秒に変換します。
式のカテゴリー: Cast, Datetime
出力タイプ: Long
引数の値:
Output: 1664614873
詳細は こちら をご覧ください。
使用可能範囲: Batch, Streaming
各単語の最初の文字を大文字にし、残りを小文字に変換します。
式のカテゴリー: String
出力タイプ: String
引数の値:
Output: Hello World
詳細は こちら をご覧ください。
使用可能範囲: Batch
CPUを使用してオーディオファイルをjsonに書き起こします。
式のカテゴリー: Media
出力タイプ: String
詳細は こちら をご覧ください。
使用可能範囲: Batch
GPUを使用してオーディオファイルをjsonに書き起こします。
式のカテゴリー: Media
出力タイプ: String
詳細は こちら をご覧ください。
使用可能
引数の値:
salarysalarysalary,入力テーブル:
| dep_name | salary |
|---|---|
| develop | -999 |
| develop | 4000 |
| develop | 3000 |
出力: 3000
詳細はこちらをご覧ください。
サポート対象: Batch
列の値の最頻値を計算します。
Expression カテゴリー: Aggregate
Type 変数の制約: String accepts String
出力タイプ: String
引数の値:
values入力テーブル:
| values |
|---|
| a |
| b |
| b |
| b |
| c |
| c |
| d |
出力: b
詳細はこちらをご覧ください。
サポート対象: Batch
ウィンドウパーティション内の行のパーセンタイルを返します。同点の場合、同じパーセンタイルが割り当てられます。
Expression カテゴリー: Aggregate
出力タイプ: Double
詳細はこちらをご覧ください。
サポート対象: Streaming
ピボットコンテキストで集計式を適用します。集計は、ピボット式の各異なる値にスコープされた個別の集計として実行されます。出力はピボット値から集計式の値へのマップです。
Expression カテゴリー: Aggregate
Type 変数の制約: K accepts ComparableType**V accepts AnyType
出力タイプ: Map<K, V>
引数の値:
value,pivot入力テーブル:
| pivot | value |
|---|---|
| a | 1 |
| b | 2 |
| a | 3 |
出力: {
a -> 4,
b -> 2,
}
詳細はこちらをご覧ください。
サポート対象: Batch
入力列の積を計算します。
Expression カテゴリー: Numeric
出力タイプ: Double
引数の値:
factor入力テーブル:
| factor |
|---|
| 2 |
| 4 |
| 3 |
出力: 24.0
詳細はこちらをご覧ください。
サポート対象: Batch
ウィンドウパーティション内の行の順位を返します。同点の場合、行は同じ順位を取得します。rank と dense_rank の違いは、同点がある場合、rank はランキングシーケンスにギャップを残すことです。
Expression カテゴリー: Aggregate
出力タイプ: Integer
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
グループ内の null でない行の数をカウントします。
Expression カテゴリー: Aggregate
出力タイプ: Long
引数の値:
values入力テーブル:
| values |
|---|
| 2 |
| 4 |
| 3 |
出力: 3
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
各パーティション内で 1 から始まる連続番号を返します。
Expression カテゴリー: Aggregate
出力タイプ: Integer
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
2 列の値の標本共分散を計算します。
Expression カテゴリー: Aggregate
出力タイプ: Double
引数の値:
leftright入力テーブル:
| left | right |
|---|---|
| 1 | 5 |
| 2 | 4 |
| 3 | 3 |
| 4 | 2 |
| 5 | 1 |
出力: -2.5
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
列の値の標本分散を計算します。
Expression カテゴリー: Aggregate
出力タイプ: Double
引数の値:
values入力テーブル:
| values |
|---|
| 2 |
| 2 |
| 3 |
出力: 0.33333333333
詳細はこちらをご覧ください。
サポート対象: Batch
列の値の標準偏差を計算します。
Expression カテゴリー: Numeric
出力タイプ: Double
引数の値:
values入力テーブル:
| values |
|---|
| 2 |
| 4 |
| 3 |
出力: 0.81649658092773
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
指定された式を合計します。
Expression カテゴリー: Numeric
出力タイプ: Decimal | Double | Long
引数の値:
values入力テーブル:
| values |
|---|
| 2 |
| 4 |
| 3 |
出力: 9
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
列の値の母分散を計算します。
Expression カテゴリー: Aggregate
出力タイプ: Double
引数の値:
values入力テーブル:
| values |
|---|
| 2 |
| 4 |
| 3 |
出力: 0.66666666667
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
配列を値ごとに行に分解します。
Expression カテゴリー: Array
Type 変数の制約: T accepts AnyType
出力タイプ: T
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
配列を値ごとに行に分解し、その要素の配列内での相対位置と要素自体を含む構造体として出力します。
Expression カテゴリー: Array
Type 変数の制約: T accepts AnyType
出力タイプ: Struct<Optional[position], Optional[element]>
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
マップをキーと値のペアごとに行に分解します。
Expression カテゴリー: Map
Type 変数の制約: TKey accepts AnyType**TValue accepts AnyType
出力タイプ: Struct<Optional[key], Optional[value]>
詳細はこちらをご覧ください。
サポート対象: Batch
指定された集計を一連の列でグループ化された入力データセットに対して実行します。
Transform カテゴリー: Aggregate, Popular
引数の値:
factor,tail_number]入力:
| tail_number | airline | miles | factor |
|---|---|---|---|
| XB-123 | foundry air | 124 | 2 |
| MT-222 | new airline | 1123 | 5 |
| XB-123 | foundry airline | 335 | 5 |
| MT-222 | new air | 565 | 4 |
| KK-452 | new air | 222 | 1 |
| XB-123 | foundry airline | 1134 | 3 |
出力:
| tail_number | factor |
|---|---|
| XB-123 | 10 |
| MT-222 | 9 |
| KK-452 | 1 |
詳細はこちらをご覧ください。
サポート対象: Batch
条件文に基づいて集計式を実行します。
Transform カテゴリー: Aggregate
詳細はこちらをご覧ください。
サポート対象: Streaming
指定された集計をウィンドウ内のデータに対して実行し、提供されたトリガーに従って出力を生成します。
Transform カテゴリー: Aggregate
詳細はこちらをご覧ください。
サポート対象: Batch
条件に一致する行を削除するために、左と右のデータセット入力をアンチ結合します。
Transform カテゴリー: Join
引数の値:
tail_number,tail_number,入力: ri.foundry.main.dataset.left
| tail_number | airline | miles | factor |
|---|---|---|---|
| XB-123 | foundry air | 124 | 2 |
| MT-222 | new airline | 1123 | 5 |
| XB-123 | foundry airline | 335 | 5 |
| MT-222 | new air | 565 | 4 |
| KK-452 | new air | 222 | 1 |
| PA-452 | new air | 212 | 2 |
| XB-123 | foundry airline | 1134 | 2 |
ri.foundry.main.dataset.right
| tail_number | home_airport |
|---|---|
| XB-123 | LHR |
| MT-222 | CPH |
| KK-452 | JFK |
| JR-201 | IAD |
出力:
| tail_number | airline |
|---|---|
| PA-452 | new air |
詳細はこちらをご覧ください。
サポート対象: Batch, Streaming
単一の式を適用して入力データセットを変換します。
Transform カテゴリー: Other
引数の値:
miles,mile,kilometer,入力:
| airline | miles |
|---|---|
| foundry airways | 2500 |
| new air | 3000 |
出力:
| kilometers | airline | miles |
|---|---|---|
| 4023.36 | foundry airways | 2500 |
| 4828.03 | new air | 3000 |
詳細はこちらをご覧ください。
サポート対象: Batch
配列から要素を抽出して列に変換します。
Transform カテゴリー: Array
引数の値:
stats入力:
| stats |
|---|
| [ 1000, 2 ] |
出力:
| miles | id | stats |
|---|---|---|
| 1000 | 2 | [ 1000, 2 ] |
詳細はこちらをご覧ください。
サポート対象: Streaming
入力にタイムスタンプとウォーターマークを割り当て、タイムスタンプが null のレコードをフィルター処理する。
Transform カテゴリー: Other
引数の値:
timestamp入力:
| timestamp | temperature | sensor_id |
|---|---|---|
| 1969-12-31T23:59:50Z | 28 | sensor_1 |
| 1969-12-31T23:59:40Z | 30 | sensor_2 |
| 1969-12-31T23:59:35Z | 29 | sensor_1 |
出力:
| timestamp | temperature | sensor_id |
|---|---|---|
| 1969-12-31T23:59:50Z | 28 | sensor_1 |
| 1969-12-31T23:59:40Z | 30 | sensor_2 |
| 1969-12-31T23:59:35Z | 29 | sensor_1 |
詳細はこちらをご覧ください。
サポート対象: Batch
パーティションの数を減らす操作です。たとえば、1000 のパーティションがあり、100 に縮小した場合、シャッフルは行われず、100 の新しいパーティションのそれぞれが現在のパーティションの 10 を取得します。より多くのパーティションが要求された場合、現在のパーティション数のままになります。
Transform カテゴリー: Other
詳細はこちらをご覧ください。
サポート対象: Batch
新しい行に対して式を計算します。キーに対する値は一度だけ計算され、ビルド間でも同じです。
Transform カテゴリー: Other
詳細はこちらをご覧ください。
サポート対象: Batch
メディアセット内のメディアリファレンスとメディアアイテムの基本メタデータを含むデータセットを生成します。他のメディアトランスフォームを適用するには、まずこのトランスフォームを使用します。
Transform カテゴリー: File, Media
詳細はこちらをご覧ください。
サポート対象: Batch
左と右のデータセット入力をクロス結合し、各側のすべての行を他の側のすべての行と一致させます。出力は 2 つのデータセットのデカルト積です。
Transform カテゴリー: Join
引数の値:
入力: ri.foundry.main.dataset.left
| tail_number | airline | miles | factor |
|---|---|---|---|
| XB-123 | foundry air | 124 | 2 |
| MT-222 | new airline | 1123 | 5 |
| PA-452 | new air | 212 | 2 |
引数の値:
geometryColLhs, geometryColRhs)入力: ri.foundry.main.dataset.left
| geometryColLhs | col1Lhs |
|---|---|
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 |
| {"coordinates": [55.0, 5.0], "type":"Point"} | 43.0 |
ri.foundry.main.dataset.right
| geometryColRhs | col1Rhs |
|---|---|
| {"coordinates": [[[2.0, 2.0], [7.0, 2.0], [7.0, 7.0], [2.0, 7.0], [2.0, 2.0]]], "type": "Polygon"} | rhsVal1 |
| {"coordinates": [[[12.0, 12.0], [17.0, 12.0], [17.0, 17.0], [12.0, 17.0], [12.0, 12.0]]], "type": "Polygon"} | rhsVal2 |
| {"coordinates": [0.0, 0.0], "type":"Point"} | rhsVal3 |
| {"coordinates": [15.0, 15.0], "type":"Point"} | rhsVal4 |
| {"coordinates": [[-1.0, -1.0], [5.0, 5.0]], "type":"LineString"} | rhsVal5 |
| {"coordinates": [[20.0, 20.0], [21.0, 23.0]], "type":"LineString"} | rhsVal6 |
| {"coordinates": [[-1.0, -1.0], [5.0, 5.0]], "type":"LineString"} | rhsVal7 |
| {"coordinates": [[20.0, 20.0], [21.0, 23.0]], "type":"LineString"} | rhsVal8 |
| {"coordinates": [[[[2.0, 2.0], [7.0, 2.0], [7.0, 7.0], [2.0, 7.0], [2.0, 2.0]]], [[[12.0, 12.0], [17.0, 12.0], [17.0, 17.0], [12.0, 17.0], [12.0, 12.0]]]], "type":"MultiPolygon"} | rhsVal9 |
| {"coordinates": [[[[170.0, 170.0], [190.0, 170.0], [190.0, 190.0], [170.0, 190.0], [170.0, 170.0]]], [[[12.0, 12.0], [17.0, 12.0], [17.0, 17.0], [12.0, 17.0], [12.0, 12.0]]]], "type":"MultiPolygon"} | rhsVal10 |
出力:
| geometryColLhs | col1Lhs | geometryColRhs | col1Rhs |
|---|---|---|---|
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 | {"coordinates": [[[2.0, 2.0], [7.0, 2.0], [7.0, 7.0], [2.0, 7.0], [2.0, 2.0]]], "type": "Polygon"} | rhsVal1 |
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 | {"coordinates": [0.0, 0.0], "type":"Point"} | rhsVal3 |
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 | {"coordinates": [[-1.0, -1.0], [5.0, 5.0]], "type":"LineString"} | rhsVal5 |
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 | {"coordinates": [[-1.0, -1.0], [5.0, 5.0]], "type":"LineString"} | rhsVal7 |
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 | {"coordinates": [[[[2.0, 2.0], [7.0, 2.0], [7.0, 7.0], [2.0, 7.0], [2.0, 2.0]]], [[[12.0, 12.0], [17.0, 12.0], [17.0, 17.0], [12.0, 17.0], [12.0, 12.0]]]], "type":"MultiPolygon"} | rhsVal9 |
| {"coordinates": [55.0, 5.0], "type":"Point"} | 43.0 | null | null |
詳細はこちらをご覧ください。
対応: バッチ
ポイントジオメトリ間の距離に基づいて左と右のデータセットを内部結合します。ジオメトリはポイントを表す必要があり、z座標を含むこともできます。内部的には、結合前にジオメトリを指定された投影座標リファレンスシステムに変換し、結合後にWGS84に戻します。非ポイントジオメトリは無視され、右のデータセット全体がドライバーおよびエグゼキューターのメモリに収まる必要があります。3 gbのエグゼキューターは、最大400万ポイントのneighborsデータセットを処理できます。
トランスフォームカテゴリー: ジオスペーシャル, 結合
引数の値:
geometryColLhs, geometryCol)入力: ri.foundry.main.dataset.left
| geometryColLhs | lhs-1 |
|---|---|
| {"coordinates": [0.0, 0.0, 0.0], "type":"Point"} | 42.0 |
| {"coordinates": [0.0, 0.0, 5.0], "type":"Point"} | 43.0 |
| {"coordinates": [0.0, 0.0], "type":"Point"} | 44.0 |
ri.foundry.main.dataset.right
| geometryCol | col1 | arrayCol |
|---|---|---|
| {"coordinates": [0.0, 0.0, 2.0], "type":"Point"} | rhsVal1 | [ 0.0, 1.0 ] |
| {"coordinates": [0.0, 1.0], "type":"Point"} | rhsVal2 | [ 0.0, 1.0 ] |
出力:
| geometryColLhs | lhs-1 | rhs_geometryCol | rhs_arrayCol |
|---|---|---|---|
| {"coordinates": [0.0, 0.0, 0.0], "type":"Point"} | 42.0 | {"coordinates": [0.0, 0.0, 2.0], "type":"Point"} | [ 0.0, 1.0 ] |
| {"coordinates": [0.0, 0.0, 0.0], "type":"Point"} | 42.0 | {"coordinates": [0.0, 1.0], "type":"Point"} | [ 0.0, 1.0 ] |
| {"coordinates": [0.0, 0.0, 5.0], "type":"Point"} | 43.0 | {"coordinates": [0.0, 0.0, 2.0], "type":"Point"} | [ 0.0, 1.0 ] |
| {"coordinates": [0.0, 0.0, 5.0], "type":"Point"} | 43.0 | {"coordinates": [0.0, 1.0], "type":"Point"} | [ 0.0, 1.0 ] |
| {"coordinates": [0.0, 0.0], "type":"Point"} | 44.0 | {"coordinates": [0.0, 0.0, 2.0], "type":"Point"} | [ 0.0, 1.0 ] |
| {"coordinates": [0.0, 0.0], "type":"Point"} | 44.0 | {"coordinates": [0.0, 1.0], "type":"Point"} | [ 0.0, 1.0 ] |
詳細はこちらをご覧ください。
対応: バッチ
入力ジオメトリが重なるかどうかに基づいて左と右のデータセットを内部結合します。結合キー列ペアにジオメトリが交差する場合、両方のデータセットからすべての列を含む行を返します。現在、複数の結合キーでの結合はサポートしていません。nullの結合キーのジオメトリ値を黙ってフィルター処理します。左と右のデータセットは同じ列名を持たないようにしてください。結合列の無効なGeoJSONは黙ってnullにします。
トランスフォームカテゴリー: ジオスペーシャル, 結合
引数の値:
geometryColLhs, geometryColRhs)]入力: ri.foundry.main.dataset.left
| geometryColLhs | lhs-1 |
|---|---|
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 |
ri.foundry.main.dataset.right
| geometryColRhs | rhs-1 |
|---|---|
| {"coordinates": [[[2.0, 2.0], [7.0, 2.0], [7.0, 7.0], [2.0, 7.0], [2.0, 2.0]]], "type": "Polygon"} | rhsVal1 |
| {"coordinates": [[[12.0, 12.0], [17.0, 12.0], [17.0, 17.0], [12.0, 17.0], [12.0, 12.0]]], "type": "Polygon"} | rhsVal2 |
| {"coordinates": [0.0, 0.0], "type":"Point"} | rhsVal3 |
| {"coordinates": [15.0, 15.0], "type":"Point"} | rhsVal4 |
| {"coordinates": [[-1.0, -1.0], [5.0, 5.0]], "type":"LineString"} | rhsVal5 |
| {"coordinates": [[20.0, 20.0], [21.0, 23.0]], "type":"LineString"} | rhsVal6 |
| {"coordinates": [[-1.0, -1.0], [5.0, 5.0]], "type":"LineString"} | rhsVal7 |
| {"coordinates": [[20.0, 20.0], [21.0, 23.0]], "type":"LineString"} | rhsVal8 |
| {"coordinates": [[[[2.0, 2.0], [7.0, 2.0], [7.0, 7.0], [2.0, 7.0], [2.0, 2.0]]], [[[12.0, 12.0], [17.0, 12.0], [17.0, 17.0], [12.0, 17.0], [12.0, 12.0]]]], "type":"MultiPolygon"} | rhsVal9 |
| {"coordinates": [[[[170.0, 170.0], [190.0, 170.0], [190.0, 190.0], [170.0, 190.0], [170.0, 170.0]]], [[[12.0, 12.0], [17.0, 12.0], [17.0, 17.0], [12.0, 17.0], [12.0, 12.0]]]], "type":"MultiPolygon"} | rhsVal10 |
出力:
| geometryColLhs | lhs-1 | geometryColRhs | rhs-1 |
|---|---|---|---|
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 | {"coordinates": [[[2.0, 2.0], [7.0, 2.0], [7.0, 7.0], [2.0, 7.0], [2.0, 2.0]]], "type": "Polygon"} | rhsVal1 |
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 | {"coordinates": [0.0, 0.0], "type":"Point"} | rhsVal3 |
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 | {"coordinates": [[-1.0, -1.0], [5.0, 5.0]], "type":"LineString"} | rhsVal5 |
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 | {"coordinates": [[-1.0, -1.0], [5.0, 5.0]], "type":"LineString"} | rhsVal7 |
| {"coordinates": [[[0.0, 0.0], [10.0, 0.0], [10.0, 10.0], [0.0, 10.0], [0.0, 0.0]]], "type": "Polygon"} | 42.0 | {"coordinates": [[[[2.0, 2.0], [7.0, 2.0], [7.0, 7.0], [2.0, 7.0], [2.0, 2.0]]], [[[12.0, 12.0], [17.0, 12.0], [17.0, |
サポートされている形式: Batch, Streaming
ウィンドウ内のデータに対して指定された集計を実行します。新しい行が受信されるたびに 1 行を出力します。
トランスフォームカテゴリー: Aggregate
詳細は こちらをご覧ください。
サポートされている形式: Batch, Streaming
列のセットの名前を変更します。
トランスフォームカテゴリー: Data preparation, Popular
引数の値:
recently_serviced, does_not_require_service)]入力:
| recently_serviced | tail_number | airline_code |
|---|---|---|
| true | KK-150 | KK |
| false | XB-120 | XB |
| true | MT-190 | MT |
出力:
| does_not_require_service | tail_number | airline_code |
|---|---|---|
| true | KK-150 | KK |
| false | XB-120 | XB |
| true | MT-190 | MT |
詳細は こちらをご覧ください。
サポートされている形式: Batch
任意に指定されたパーティショニング列と結果のパーティション数に基づいてデータのシャッフルを強制します。これらが指定されていない場合、パーティショニングは自動的に決定されます。
トランスフォームカテゴリー: Other
詳細は こちらをご覧ください。
サポートされている形式: Batch
入力データセットに対して異なる粒度で指定された集計を実行し、中間およびスーパー集計を提供します。
トランスフォームカテゴリー: Aggregate
引数の値:
price,city, model]入力:
| city | model | price | store |
|---|---|---|---|
| London | new phone | 900.0 | MegaMart |
| London | new phone | 850.75 | AA |
| London | new phone | 870.75 | ABC Zone |
| San Francisco | new phone | 1000.0 | Prescos |
| San Francisco | new phone | 950.25 | XZY Force |
| San Francisco | new phone | 1105.7 | Phone Mart |
| London | forestX 20 | 750.1 | MegaMart |
| London | forestX 20 | 690.0 | AA |
| London | forestX 20 | 730.0 | ABC Zone |
| San Francisco | forestX 20 | 890.4 | Prescos |
| San Francisco | forestX 20 | 900.1 | XZY Force |
| San Francisco | forestX 20 | 1050.75 | Phone Mart |
出力:
| city | model | mean_price |
|---|---|---|
| London | new phone | 873.8333333333334 |
| London | forestX 20 | 723.3666666666667 |
| London | null | 798.6 |
| San Francisco | new phone | 1018.65 |
| San Francisco | forestX 20 | 947.0833333333334 |
| San Francisco | null | 982.8666666666667 |
| null | null | 890.7333333333335 |
詳細は こちらをご覧ください。
サポートされている形式: Batch
JVM内の単一行のサイズを推定します。
トランスフォームカテゴリー: Other
詳細は こちらをご覧ください。
サポートされている形式: Batch, Streaming
入力データセットから列のセットを選択します。
トランスフォームカテゴリー: Popular
詳細は こちらをご覧ください。
サポートされている形式: Batch
左と右のデータセット入力をセミジョインします。結合条件に一致しないすべての行を削除します。
トランスフォームカテゴリー: Join
引数の値:
tail_number,tail_number,入力: ri.foundry.main.dataset.left
| tail_number | airline | miles | factor |
|---|---|---|---|
| XB-123 | foundry air | 124 | 2 |
| MT-222 | new airline | 1123 | 5 |
| XB-123 | foundry airline | 335 | 5 |
| MT-222 | new air | 565 | 4 |
| KK-452 | new air | 222 | 1 |
| PA-452 | new air | 212 | 2 |
| XB-123 | foundry airline | 1134 | 2 |
ri.foundry.main.dataset.right
| tail_number | home_airport |
|---|---|
| XB-123 | LHR |
| MT-222 | CPH |
| KK-452 | JFK |
| JR-201 | IAD |
出力:
| tail_number | airline | miles | factor |
|---|---|---|---|
| XB-123 | foundry air | 124 | 2 |
| MT-222 | new airline | 1123 | 5 |
| XB-123 | foundry airline | 335 | 5 |
| MT-222 | new air | 565 | 4 |
| KK-452 | new air | 222 | 1 |
| XB-123 | foundry airline | 1134 | 2 |
詳細は こちらをご覧ください。
サポートされている形式: Batch
入力データセットを列を選択するか、列に関数を適用することで変換します。
トランスフォームカテゴリー: Other
引数の値:
b, DESCENDING)]入力:
| a | b |
|---|---|
| 1 | 2 |
| 3 | 4 |
| 5 | 6 |
出力:
| a | b |
|---|---|
| 5 | 6 |
| 3 | 4 |
| 1 | 2 |
詳細は こちらをご覧ください。
サポートされている形式: Batch, Streaming
トランスフォーム間にテキスト説明を挿入します。これにより入力データは一切変換されません。
トランスフォームカテゴリー: Other
詳細は こちらをご覧ください。
サポートされている形式: Streaming
指定された列のサブセットに対して入力の重複行を削除します。行が一定のイベント時間後に期限切れになります。設定されたイベント時間を超えて遅れて到着する行は常に削除されます。指定されたキーでパーティションを分けます。各重複削除は、異なるキー列値に対して個別に計算されます。
トランスフォームカテゴリー: Other
詳細は こちらをご覧ください。
サポートされている形式: Streaming
キー列のすべての値が同じで順序が乱れている行を削除します。並べ替え列と方向に基づいて同じキー値を持つすでに受信された行の前に来る行は順序が乱れていると見なされます。2つの行は、最初に並べ替え列と方向を評価し、次にタイが発生した場合にのみ次の並べ替え列と方向に進むことで比較され、順序が決定されるか、すべての並べ替え列が同じ場合は行が等しいことになります。各キーの現在の最大値は、キーに対して新しい行がイベント時間の期限以上に見られなくなるまで保存されます。キーに対して新しい行が期限以上に見られなくなった後、そのキーの新しい行は決して削除されず、新しい現在の最大値として常に保存されます。
トランスフォームカテゴリー: Other
詳細は こちらをご覧ください。
サポートされている形式: Streaming
遅れて到着するレコードを許容するイベント時間順にキーごとに行を昇順で出力します。許容される遅延プラス小さなバッファ間隔を超えて到着するレコードは削除されます。
トランスフォームカテゴリー: Other
詳細は こちらをご覧ください。
サポートされている形式: Batch
各並べ替えパーティションで上位の行を選びます。
トランスフォームカテゴリー: Aggregate
引数の値:
airline}airport, DESCENDING), (miles, ASCENDING)]入力:
| airline | airport | miles |
|---|---|---|
| foundry airways | JFK | 1002345 |
| foundry airways | LHR | 2221324 |
| new air | SFO | 21356673 |
| new air | JFK | 12323456 |
| foundry airways | LHR | 12542352 |
| new air | JFK | 12232355 |
出力:
| airline | airport | miles |
|---|---|---|
| foundry airways | LHR | 2221324 |
| new air | SFO | 21356673 |
詳細は こちらをご覧ください。
サポートされている形式: Batch, Streaming
一致する列名でデータセットを結合します。
トランスフォームカテゴリー: Join
引数の値:
入力: ri.foundry.main.dataset.a
| recently_serviced | tail_number | airline_code |
|---|---|---|
| true | KK-150 | KK |
| false | XB-120 | XB |
| true | MT-190 | MT |
ri.foundry.main.dataset.b
| recently_serviced | tail_number | airline_code |
|---|---|---|
| true | AA-200 | AA |
| true | BN-435 | BN |
| true | BN-111 | BN |
出力:
| recently_serviced | tail_number | airline_code |
|---|---|---|
| true | KK-150 | KK |
| false | XB-120 | XB |
| true | MT-190 | MT |
| true | AA-200 | AA |
| true | BN-435 | BN |
| true | BN-111 | BN |
詳細は こちらをご覧ください。
サポートされている形式: Batch, Streaming
ピボットの反対を行います。
トランスフォームカテゴリー: Aggregate, Popular
型変数の制約: T は AnyType を受け入れる
引数の値:
new_york_miles, london_miles]入力:
| airline | new_york_miles | london_miles |
|---|---|---|
| foundry airways | 1000 | 6000 |
| new air | null | 8000 |
出力:
| city | miles | airline |
|---|---|---|
| new_york_miles | 1000 | foundry airways |
| london_miles | 6000 | foundry airways |
| new_york_miles | null | new air |
| london_miles | 8000 | new air |
詳細は こちらをご覧ください。
サポートされている形式: Batch, Streaming
列名のスーパーセットに基づいてデータセットを結合し、列が欠落している場合は null を追加します。
トランスフォームカテゴリー: Join
引数の値:
入力: ri.foundry.main.dataset.a
| recently_serviced | tail_number |
|---|---|
| true | KK-150 |
| false | XB-120 |
| true | MT-190 |
ri.foundry.main.dataset.b
| recently_serviced | tail_number | airline_code |
|---|---|---|
| true | AA-200 | AA |
| true | BN-435 | BN |
| true | BN-111 | BN |
出力:
| recently_serviced | tail_number | airline_code |
|---|---|---|
| true | KK-150 | null |
| false | XB-120 | null |
| true | MT-190 | null |
| true | AA-200 | AA |
| true | BN-435 | BN |
| true | BN-111 | BN |
詳細は こちらをご覧ください。
サポートされている形式: Batch
指定された集計を、列のセットでグループ化された入力データセットに対して実行します。
トランスフォームカテゴリー: Aggregate, Popular
詳細は こちらをご覧ください。