数据连接与集成数据连接Direct connections, agents, and agent proxies设置代理

注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

设置代理

代理是一个可下载的程序,安装在您的组织网络中,并从 Foundry 的 数据连接 界面进行管理。代理能够连接到组织网络内的不同数据源。它们被 代理工作器运行时 用于从这些来源读取数据,并以受限访问词元安全地摄取到 Foundry中,还被 代理代理 运行时用于提供到这些来源的网络连接。

本指南将指导您完成创建代理所需的步骤。首先,完成以下步骤:

  1. 登录 Palantir 后,使用左侧侧边栏导航到 数据连接
  2. 选择 代理 标签。
  3. 在右上角选择 新建代理

如果您没有看到创建新代理的选项,您可能没有所需的角色。了解更多关于在控制面板中管理代理创建流程的信息。

一旦代理运行,并且您想将数据源连接到 Foundry,您必须获取代理可以用来安全读取数据的源系统凭据。根据您组织的网络设置,您可能还需要配置网络设置以允许代理访问源系统。

查看以下部分以开始设置您的代理:

设置

创建代理主机

为了使代理程序成功运行,必须在合适的环境中托管(理想情况下,使用 Linux 作为操作系统的环境)。

Foundry 代理最常用的托管方法是在云环境中配置 Linux 虚拟机(VM)。例如,您可以在 AWS、Azure 或 GCP 中配置 Linux VM,但您也可以将代理托管在属于您组织的 Linux 服务器上。请注意,虽然可以在 Windows 上托管 Foundry 代理,但 Palantir 不推荐这样做,除非无法在 Linux 环境中进行托管。

一旦您有了合适的代理托管位置,下一步是确保主机满足 Foundry 代理工作的必要硬件和操作系统要求。这些要求包括:

  • 64位 Linux 或其他 Linux 操作系统(推荐 RHEL 8、Ubuntu 22.04 或同等)

    • 代理运行在为 Linux/x86-64 编译的专用 JDK 上。如有必要(例如,在 AWS Graviton 或其他基于 ARM 的 CPU 上运行时),可以通过修改 service/bin/launcher-static.yml 中的 javaHome 值,使用单独的 JDK 运行代理。

      我们一般不推荐在单独的 JDK 上运行代理,未来可能不支持此功能。

  • 4 个 CPU 核心

  • 16 GB 内存

  • 500GB 挂载在 /opt 的可用磁盘空间(最好是 SSD)

  • 用于代理的主机应专用于运行单一的 Foundry 代理,不与任何其他服务或进程共同托管。

推荐的限制如下:

  • 核心文件大小:硬限制和软限制为 0
  • 打开文件:硬限制和软限制为 262144
  • 运行进程:硬限制和软限制为 65536
  • 堆栈大小:硬限制和软限制为 32768
  • 最大锁定内存:硬限制和软限制为 "无限制"
代理要求

配置代理网络访问

假设您的代理已安装在您的组织网络内的主机上,代理将需要网络出口以访问通过互联网访问的 Foundry VPC(虚拟专用云)。如果您的网络默认不允许出口,这可能需要特定的配置以允许代理(和/或其主机)与您的 Foundry 实例进行出站连接,例如打开防火墙或配置代理以进行出口。

第一步,确保从服务器到 Foundry 的出口是可用的。您可以从平台中的代理设置流程的 服务器设置 标签复制域名和端口,以适当地配置网络访问。

数据连接中网络出口如何工作的示意图。

要验证您的主机是否可以与 Foundry VPC 通信,请在您的 VM 上执行以下命令:

Copied!
1 curl -s https://<your domain name>/magritte-coordinator/api/ping > /dev/null && echo pass || echo fail

该命令用于检查指定 API 的可访问性。以下是详细说明:

  • curl -s: 使用 curl 命令发送 HTTP 请求,-s 选项表示静默模式,不输出任何进度信息。
  • https://<your domain name>/magritte-coordinator/api/ping: 这是要请求的 API URL,请将 <your domain name> 替换为实际的域名。
  • > /dev/null: 将请求的输出重定向到 /dev/null,即忽略输出。
  • && echo pass: 如果 curl 请求成功(返回状态码为 200),则输出 pass
  • || echo fail: 如果 curl 请求失败,则输出 fail

此命令用于快速检测 API 的健康状态,如果正常运行会输出 pass,否则输出 fail。 如果一切正常运行,您应该会看到 pass 作为输出。

请注意,ping 表示对 Foundry VPC 的连接性测试尚未完成。

保护代理主机

为了仅允许您的用户连接到网络内的一组有限目标,我们建议配置代理主机的防火墙以阻止所有流量,除非到达所需目标。请务必仍然允许代理主机与 Palantir 通信。

设置自动重启

如果未设置自动重启,当代理崩溃或代理主机重启时,您将会遇到停机。

要为代理管理器设置自动重启,如果它崩溃,请在有权限创建定时任务的用户身份下,从代理管理器的服务目录在虚拟机或机器终端上运行命令 ${AGENT_MANAGER_DIR}/service/bin/auto_restart.sh

如果需要停止自动重启(例如在升级代理管理器时),可以通过运行 ${AGENT_MANAGER_DIR}/service/bin/auto_restart.sh clear 来实现。

将代理资源保存到项目中

接下来,您必须为新的代理命名并选择一个项目以保存它。在 Foundry 中,代理被视为 资源,保存到项目中以允许高度可配置的权限。

我们建议创建一个新的项目来存储您的代理。

Foundry 中的权限是一个广泛的话题。如果您想了解更多,可以参考以下资源:

下载并安装代理

一旦为代理提供了硬件,下一个步骤是从 Foundry 下载代理软件并将其安装到主机上。按照主机上的平台内指南中的步骤下载软件包,解压并启动代理。

如果需要配置代理服务器,更多详细信息请参阅 代理服务器配置文档

代理成功启动后,请按照步骤 配置自动升级,以确保您的代理保持更新。

下一步

现在您已经创建、安装并启动了代理,请导航到 Data Connection 中的代理页面,在那里您可以 配置和监控代理权限、健康状况和连接性

代理设置完成后,您可以继续 设置源 以将代理与组织的数据源连接。