注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
数据源是您连接到 Foundry 的任何外部数据。例如,数据源可以是 Postgres 数据库、S3 存储桶、Linux 服务器上的文件系统、SAP 实例或互联网上的 REST API。
从总体上看,以下是将数据源连接到 Foundry 所需的步骤。请注意,步骤 1 到步骤 3 可能需要您更改或验证现有架构中的配置:
一旦建立了这个数据源连接,您可以配置同步以将特定的数据集导入 Foundry。同步可以完全通过数据连接 UI 配置,因此数据源设置是可能需要在您组织的环境中更新配置的最后任务,然后您才能在 Foundry 中访问您的数据。
要将 Foundry 连接到数据源,首先验证网络连接。使用代理的数据源需要两个有效的网络连接:(1)从代理主机到数据源,(2)从代理主机到 Foundry。直接连接只需要一个有效的网络连接:从 Foundry 到数据源。
您需要确保在已设置在您网络中的代理和数据源之间有连接。代理充当从您网络到 Foundry 的单一验证入口,并将处理读取和发送数据到 Foundry VPC 的过程;对于每个新的数据源,您只需要确保代理和新数据源之间有有效连接。
您无需建立从数据源到 Foundry 的直接网络出口,因为流量只从代理流向 Foundry,并从代理流向数据源。了解更多关于数据连接的架构。
建立此连接所需的步骤将根据您组织的网络设置而有所不同。无论您的具体设置如何,目标是使代理能够连接到数据源。这可能涉及到在代理主机上的出口设置配置、数据源上的入口设置、网络上的防火墙规则、代理上的代理设置、将数据源系统证书添加到代理信任库等。
如果您需要配置代理设置以使代理能够到达数据源,您可以通过数据连接界面进行设置。
在大多数情况下,Foundry 需要授权凭证(如用户名和密码)来访问数据源。最佳实践是使用专门为 Foundry 设立的服务账户。请注意,即使您有多个代理,也只需要一组凭证——凭证与 Foundry 中的特定数据源资源相关联,并将由您指派给该数据源的任何代理使用。
根据您组织为建立服务账户制定的任何内部指南和流程,为数据源提供服务账户。在继续下一步之前记下凭证。
JDBC 数据源可能需要添加连接到您的数据源所需的驱动程序。对于基于代理的数据源,您需要在代理设置页面中为您打算用于数据源连接的代理添加驱动程序。
完成上述步骤后,您可以继续在数据连接中创建数据源:
接下来,命名您的数据源并选择一个项目放置在其中。我们通常建议为每个数据源创建一个新项目,因为这为从该数据源派生的数据集提供了最自然的权限方式。
您可以阅读更多关于数据源权限最佳实践的信息,或查阅如何在 Foundry 中端到端构建数据管道的完整指南。
选择右下角的创建数据源并继续。
添加有关如何连接到您的数据源的详细信息。这些将取决于您正在使用的数据源类型,通常包括基本凭证,如连接 URL、云提供商区域等。
添加您之前提供的凭证以允许数据源连接到您的数据。
选择右下角的保存以完成数据源的设置。一旦您的数据源完全设置,您可以继续设置同步以将数据导入 Foundry。
如果数据源不能正常工作,请检查以下内容: