注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

Funnel流式管道

除了批量Ontology数据索引之外,Object Storage V2还通过使用Foundry流作为输入数据源,支持低延迟流式数据索引到Ontology。通过不同于非流式Foundry数据集的批量基础设施,流使数据能够在几秒钟或几分钟内索引到Foundry Ontology中,以支持对延迟敏感的操作工作流。

如果您对Ontology流式行为有更多疑问,请查看我们的常见问题文档。

有关流式管道性能和延迟的指导,请查看我们的流式性能考虑文档。

流式Object类型的当前产品限制

Object Storage V2中的流使用“最新更新优先”的策略,其中每个流被视为变更日志流。如果您的事件是无序的,您将在Ontology中得到不正确的数据。如果您可以保证输入流中的顺序,Object Storage V2流将按相同的顺序处理您的更新。

Ontology流式行为及其功能集仍在积极开发中;以下是使用Ontology流之前的一些当前产品限制:

  • 用户编辑不支持流式Object类型。作为一种解决方法,您可以将用户编辑作为数据更改推送到输入流中,或配置一个具有非流式输入数据源的附加Object类型,以便用户在该辅助Object类型上进行编辑。
  • 多数据源Object类型(MDOs)不支持流式Object类型。
  • 除了Workshop之外,没有其他Foundry前端应用支持实时数据刷新,因为从历史上看,它们不期望流式更新。尽管基础的Ontology数据对于流式Object类型来说不断变化,但在Workshop之外,每当您需要新数据时,您都需要刷新。
  • 在Ontology Manager中Object类型的数据源选项卡中,用户能够为Funnel批处理管道出错和无效记录配置监控器。目前,不支持具有流数据源的Object类型的监控器或指标(例如,管道延迟)。

配置流式Object类型

具有流输入数据源的Object类型直接在Pipeline BuilderOntology Manager中配置,类似于任何其他Foundry Ontology Object类型。

如果您尚未配置输入流,可以通过在数据连接应用中与现有流集成或通过在Pipeline Builder中搭建流管道来创建一个。

创建新Object类型(或使用现有Object类型)后,导航到Ontology Manager中的数据源选项卡,在支持数据源部分选择一个流输入数据源,如下所示,并将您的更改保存到Foundry Ontology中。

一个Ontology流配置

对于输入数据源流的附加配置,请选择省略号按钮以获取更多选项,如下所示。

附加流配置 附加流配置

流数据源还可以配置为多对多链接类型

调试流式管道

流与Ontology之间的接口在概念上可以视为变更日志数据集。输入流中的每条记录将包含写入Ontology的每个属性的数据。每条记录将更新指定主键的给定Object的所有属性。可以通过在输入流上设置元数据来指定输入记录上的删除。

Funnel将按写入数据源流的顺序索引记录,因此这些流应按主键分区并按事件时间戳排序,这可以在上游Pipeline Builder管道中完成。

如果您的流管道有问题,请查看调试失败的流文档。