注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
除了批量Ontology数据索引之外,Object Storage V2还通过使用Foundry流作为输入数据源,支持低延迟流式数据索引到Ontology。通过不同于非流式Foundry数据集的批量基础设施,流使数据能够在几秒钟或几分钟内索引到Foundry Ontology中,以支持对延迟敏感的操作工作流。
Object Storage V2中的流使用“最新更新优先”的策略,其中每个流被视为变更日志流。如果您的事件是无序的,您将在Ontology中得到不正确的数据。如果您可以保证输入流中的顺序,Object Storage V2流将按相同的顺序处理您的更新。
Ontology流式行为及其功能集仍在积极开发中;以下是使用Ontology流之前的一些当前产品限制:
具有流输入数据源的Object类型直接在Pipeline Builder或Ontology Manager中配置,类似于任何其他Foundry Ontology Object类型。
如果您尚未配置输入流,可以通过在数据连接应用中与现有流集成或通过在Pipeline Builder中搭建流管道来创建一个。
创建新Object类型(或使用现有Object类型)后,导航到Ontology Manager中的数据源选项卡,在支持数据源部分选择一个流输入数据源,如下所示,并将您的更改保存到Foundry Ontology中。
对于输入数据源流的附加配置,请选择省略号按钮以获取更多选项,如下所示。
流数据源还可以配置为多对多链接类型。
流与Ontology之间的接口在概念上可以视为变更日志数据集。输入流中的每条记录将包含写入Ontology的每个属性的数据。每条记录将更新指定主键的给定Object的所有属性。可以通过在输入流上设置元数据来指定输入记录上的删除。
Funnel将按写入数据源流的顺序索引记录,因此这些流应按主键分区并按事件时间戳排序,这可以在上游Pipeline Builder管道中完成。
如果您的流管道有问题,请查看调试失败的流文档。