注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

架构

Palantir AIP(人工智能平台)旨在扩展至所有类型的终端用户、全球最苛刻的数据驱动型工作负载以及各种基础设施基板。为实现这一目标,底层服务网格在由 Palantir Apollo ↗ 强制执行的一组软件定义原则之上运行。

随着AIP的范围和功能集的扩展,并成为许多机构的关键任务,我们需要确保:

  • 平台内的数百项服务均以高可用性、冗余配置运行。除了核心后端服务,这还包括前端应用服务、分析工具、应用构建器以及每种用户类型所使用的各组成服务。
  • 所有服务升级均在零停机状态下执行,具有细粒度监控,以告知如何部署、监控并可能回滚升级策略。由Apollo作为所有服务编排的全局骨干,安全自动化的水平远远超过手动或定制操作所能实现的。
  • 核心服务和相关计算网格的自动扩展利用一致的容器化范式。这是通过 Rubix ↗ 引擎实现的,该引擎支撑平台的所有自动扩展基础设施,并与Apollo交付平台密切配合。

architecture

由Rubix和Apollo共同驱动的服务网格包含模块化功能,可以集成到现有企业架构中。此外,平台架构最大限度地提高了未来的灵活性,以确保客户能够持续受益于最新技术,无论是由Palantir还是开源社区开发的:

  • 存储架构不绑定于任何特定的底层范式。平台在架构的不同层次上使用多种存储技术。这包括blob存储(或HDFS)、水平可扩展的键/值存储、水平可扩展的关系数据库和多模式时间序列子系统等。

  • 计算架构不绑定于任何特定的底层基础设施。平台不同层次的不同工作负载利用特定的运行时,每个层面都设计了灵活性。数据集成的常用运行时包括Apache Spark和Apache Flink,但如果需要,可以使用外部变换引擎。Palantir开发的引擎为Ontology和其他不易映射到现有计算模式的功能集提供支持。

  • 我们努力确保最流行的开放语言在代码驱动的范式中安全且一致地可用。这包括用于数据变换的 PythonSQLJava;用于机器学习工作流的 Python 和 R;以及用于定义工作流和前端应用的 TypeScriptJavaScript

  • 安全性和传承是AIP中每个操作的核心,并在平台架构的每一层级始终如一地执行。这确保没有单一服务(或终端用户)负责执行企业的现有安全策略,或实施维持来源所需的“记账”。从数据到决策,高可用的核心服务被设计为应用、执行和跟踪已配置、同步和/或继承的治理策略。