注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
AIP Logic 是 Palantir 的一种工具,允许您在通过 Ontology 和计算功能与组织的数据交互时,快速且可维护地搭建 LLM 驱动的流程。AIP Logic 围绕可以线性组合的 LLM 指令的“块”的概念构建,以创建链式思维工作流,可以查询数据、执行操作和函数,并生成新的信息以用于您的应用案例。在 AIP Logic 中,“块”是使用测量的基本单位,尽管每个块可以触发 Foundry 内的其他系统,这些系统也可能使用计算秒来将信息返回给 AIP Logic 块。
如果您与 Palantir 签订了企业合同,请在进行计算使用量计算之前联系您的 Palantir 代表。
AIP Logic 资源 由一个或多个 AIP Logic 块 组成。运行资源将运行实现所需输出所需的块。块可以使用 工具,如 Ontology 查询、函数和操作来生成输出。
AIP 中的 LLM 词元根据底层模型(如 OpenAI ↗)的方式进行测量,并且取决于提示和响应的大小以及所做提示的数量。有关详细信息,请参阅各模型类型的使用表。
当 AIP Logic 块执行或选择使用工具时,会有一个最低计算秒使用量。
4
计算秒8
计算秒当 AIP Logic 块将计算委派给外部工具(如 Ontology 查询或函数)时,可能在这些应用执行期间使用额外的计算。
AIP Logic 中的一些操作会显著影响计算使用量。下面,我们提供了通过仔细控制词元使用、逻辑块执行总数和Foundry 计算使用来控制计算使用量的指导。
假设用户有一个包含两个 LLM 块的 AIP Logic 资源。其中一个 LLM 块配置了一个操作,并将在执行时调用它。逻辑资源从头到尾运行了两次。
Number of LLM blocks: 2
Number of LLM blocks that call actions: 1
Number of runs: 2
1 run compute-seconds = 2 LLM blocks * 4 compute-seconds + 1 action block * 8 compute-seconds
1 run compute-seconds = (2 * 4) + (1 * 8)
1 run compute-seconds = 16 compute-seconds
# 计算一个运行的总计算秒数
# 2 个 LLM 区块,每个占用 4 个计算秒数,加上 1 个 action 区块,占用 8 个计算秒数
# 因此,一个运行需要的计算时间为 (2 * 4) + (1 * 8) = 16 计算秒数
2 runs = 2 * 16 compute-seconds = 32 compute-seconds
# 总共运行 2 次,总计算秒数为 2 * 16 = 32 计算秒数
Total = 32 compute-seconds