Search
Palantir
Documentation
搜索文档
Search
karat
+
K
API 参考 ↗
Send feedback
ZH
en
jp
kr
zh
AB
XY
AB
XY
AB
XY
AB
XY
AB
XY
AB
XY
AB
XY
功能
数据连接与集成
用例开发
分析
模型集成
开发运维
安全
本体
管理
入门
平台概述
数据连接与集成
数据连接与集成
连接数据
什么是数据管道?
应用参考
Core concepts
数据集
流
媒体集(非结构化数据)
分支
搭建
调度
健康检查
虚拟表
变更数据捕获 (CDC)
视图
连接数据
数据连接
概述
核心概念
代理架构
初始设置概述
数据连接常见问题
Direct connections, agents, and agent proxies
设置直接连接
设置代理
代理配置参考
代理工作器
代理代理运行时配置参考
故障排除参考
OpenID Connect (OIDC) 身份验证
Sources
设置数据源
源探索
Syncs
设置批量同步
设置流式同步
基于文件的同步
媒体集同步
优化 JDBC 同步
故障排除参考
将数据推入流
Exports
概览
导出任务(旧版)
Webhooks
概述
设置 Webhook
配置参考
权限参考
将同步添加到Marketplace产品 [测试版]
将虚拟表添加到Marketplace产品 [Beta]
Hyperauto
概览
HyperAuto V2 架构
HyperAuto V2 支持的来源
HyperAuto V2 入门指南
提案
HyperAuto V2 配置选项
基于文件夹的SAP数据管道
HyperAuto中的AIP功能
HyperAuto V1
HyperAuto V1 概述
开始使用 HyperAuto V1
数据源探索
SDDI 控制台
配置参考
从 HyperAuto V1 迁移到 V2
HyperAuto V1 常见问题
外部变换
基于源的外部变换
外部函数
连接器类型参考
连接器
可用连接器
Act! CRM
Act-On
ActiveCampaign
Acumatica
Adobe Analytics
Adobe Commerce
ADP
代理级文件系统
Airtable
AlloyDB
Amazon DynamoDB
Amazon Kinesis
Amazon Marketplace
Amazon S3
Apache CouchDB
Apache HBase
Apache Hive
Apache Phoenix
Asana
Authorize.Net
Avalara
Azure Active Directory
Azure Blob Filesystem (ABFS)
Azure Cosmos DB
Azure 数据目录
Azure DevOps
Azure Synapse
Azure Table Storage
Basecamp
BigCommerce
BigQuery
Blackbaud Raisers Edge NXT
Bugzilla
Bullhorn CRM
Cassandra
Certinia
Cloudant
CockroachDB
Confluence
Couchbase
Databricks
DocuSign
Domino
eBay
eBay 分析
EnterpriseDB
Exact Online
Facebook
Facebook 广告
FreshBooks
Freshdesk
FTP/FTPS
GitHub
通用连接器
Gmail
Google Campaign Manager
Google Cloud Storage
Google Contacts
Google Data Catalog
Google 目录
Google Drive
Google Pub/Sub
Google 搜索
Google Spanner
GraphQL
Greenplum
HDFS
Highrise
Hubspot
IBM Cloud 数据引擎
IBM Cloud Object Storage
Instagram
自定义 JDBC 源
Jira服务管理
Kafka
Kintone
LDAP
LinkedIn
LinkedIn 营销解决方案
Mailchimp
Marketo
MarkLogic
Microsoft Access
Microsoft Ads
Microsoft Bing
Microsoft Dataverse
Microsoft Dynamics 365
Microsoft Dynamics CRM
Microsoft Dynamics NAV
Microsoft Excel
Microsoft Excel Online
Microsoft Exchange
Microsoft Office 365
Microsoft OneDrive
Microsoft OneNote
Microsoft Planner
Microsoft Power BI® XMLA
Microsoft Project
Microsoft SQL Server
Microsoft Teams
Monday
MYOB
NoSQL 存储
OData
Odoo
Oracle Eloqua
Oracle Fusion Cloud Financials
Oracle Fusion Cloud HCM
Oracle Fusion Cloud SCM
Oracle NetSuite
Oracle NetSuite 概述
Oracle NetSuite SuiteAnalytics
Oracle NetSuite SuiteQL
Oracle NetSuite SuiteTalk
Oracle Sales
Oracle 服务云
外展
Paylocity
PayPal
Pinterest
Pipedrive
PostgreSQL
Presto
Quickbase
QuickBooks Desktop
QuickBooks Online
QuickBooks POS
Raisers Edge NXT
Reckon
Reckon Accounts 托管
Redis
旧版 REST API 插件 (magritte-rest-v2)
REST
Sage 200
Sage 300
Sage 50 UK
Sage Business Cloud Accounting
Salesforce
Salesforce Marketing Cloud
Salesforce营销云账户互动
Salesloft
SAP Business One
SAP BusinessObjects BI
SAP ByDesign
SAP Cloud for Customer
SAP Concur
SAP Fieldglass
SAP HANA XSA
SAP SuccessFactors
SendGrid
SFTP
Sharepoint Online
ShipStation
Shopify
SingleStore
Slack [Beta]
Smartsheet
服务器消息块 (SMB)
Snapchat 广告
Snowflake
Spark SQL
Splunk
Square
Streak
Stripe
SugarCRM
SuiteCRM
SurveyMonkey
SybaseIQ
Tableau CRM 分析
Tally
TaxJar
Trello
TSheets
Twilio
Twitter 广告
Veeva Vault
Wave Financial
WooCommerce
WordPress
Xero
Xero WorkflowMax
YouTube 分析
Zendesk
Zoho Books
Zoho Creator
Zoho CRM
Zoho Inventory
Zoho Projects
Zuora
其他数据源类型
Palantir 提供的 JDBC 源驱动程序
SAP
概述
架构
下载 Palantir Foundry Connector 2.0 以用于 SAP 应用程序的附加组件
SAP Add-on
SAP 附加组件的安装
安装 Palantir Foundry Connector 2.0 以用于 SAP 应用程序
安装远程代理
为 4.6C/620/640 安装远程代理
安装支持包
安装修补包
配置 SLT(SAP Landscape Transformation Replication Server)
创建RFC连接
卸载 Palantir Foundry Connector 2.0 for SAP Applications 或远程代理
Palantir Foundry Connector 2.0 以 SAP 应用的管理控制台
Palantir Foundry Connector 2.0 以 SAP 应用程序的参数
设置和配置清理任务
授权角色
备份和恢复 Palantir Foundry Connector 2.0 以用于 SAP 应用程序
Foundry SAP Setup
创建一个新的来源
源探索
Foundry SAP 同步
创建新的流式同步
增量更新
SAP 对象类型
动态筛选
How-Tos
从SAP提取长文本
配置自定义授权和角色管理
BEx 查询
提取器
函数
事务代码和报告提取
从SAP导入HANA视图
用户归属的 SAP 数据输出与 OAuth 2.0
常见问题
工作流程
Resource guides
流式资源指南
Flink 基础
重置流
流监控 [Beta]
流式配置文件
构建管道
概述
管道类型
支持的语言
注意事项: Pipeline Builder 和代码库
Getting started
使用 Pipeline Builder 创建数据集批处理管道
使用Pipeline Builder创建媒体集批处理管道
使用代码仓库创建数据集批处理管道
使用代码库创建媒体集批处理管道
使用Pipeline Builder创建增量管道
使用Pipeline Builder创建流式管道
Incremental pipelines
概述
创建增量同步
保持高性能
Streaming pipelines
流式管道:概述
比较:流处理 vs 批处理
性能考虑
使用 Foundry Streaming 进行计算
流式密钥
流式有状态变换
Scheduling
概述
创建计划
查看和修改计划
查找和管理计划
常见调度配置
触发器类型参考
故障排除参考
向市场产品添加计划 [测试版]
Logic flows [Sunset]
概述
创建连接流
Compass 文件列出器
Best practices
推荐的项目和团队结构
开发最佳实践
分支和发布流程
调度最佳实践
搭建生产流水线
Pipelines on unstructured data
概览
为CSV或JSON文件推断架构
Security in pipelines
概述
关于移除权限标记的指南
移除继承的权限标记和组织
优化管道
概述
Debugging pipelines
调试失败任务
调试失败的管道
调试失败的流
排查内存不足(OOM)出错
排查计划
Spark
Spark 概念
理解 Spark 细节
Spark UI [测试版]
理解计算使用情况
原生加速
应用Spark配置文件
Spark配置文件参考
Dataset projections
概述
设置投影
高级细节
Optimizing pipelines
Foundry 使用优化
维护管道
概述
稳定性建议
推荐的健康检查
定义数据期望
推荐的支持流程
大规模监控
应用
管道构建器
概述
核心概念
导航
Pipeline Builder中的AIP功能
函数索引
Input datasets
概述
添加数据集
自动生成输入数据
批量输入数据集的计算模式
Transforms
概览
变换数据
合并数据
合并数据
创建地理空间变换
在Pipeline Builder中创建唯一ID
在流式Pipeline Builder管道中合并数据
在 Pipeline Builder 中使用 LLM 节点
频繁模式挖掘
Pipeline outputs
概述
添加数据集输出
添加Ontology输出
添加时空序列输出
预览管道
交付管道
从输出中移除权限标记
重大更改
Pipeline management
管道管理
添加输入采样策略
参数
搭建设置
创建自定义函数
显示和隐藏节点
Pipeline Builder 中的文件夹
颜色组
检查点
任务组
导出管道代码
Branches
概览
创建分支
提出更改
批准更改
分支保护
回退分支
Schedules
概述
创建计划
调度器中的 AIP 功能
Data expectations
数据期望
配置数据健康检查
在 Pipeline Builder 中进行单元测试
向Marketplace产品添加pipeline [Beta]
PB函数表达式
绝对值
数字相加
添加或更新结构体字段
向日期添加值
所有数组元素满足
全部
And
任意数组元素满足
任意
近似中位数
近似百分位数
Arccos
Arcsin
Arctan
Arctan2
区域
数组添加
数组笛卡尔积
数组合并
数组包含
数组包含null
数组差异
数组去重
数组元素
数组元素是唯一的
数组扁平化
数组交集
数组最大值
数组最小值
数组位置
数组移除
数组重复
数组反转
数组排序
数组合并
数组有交集
数组 zip
Base 64 解码为字符串
Base64 解码
Base64 编码
左移位
位移右移
缓冲 H3 索引
计算目的地点
计算haversine距离
案例
转换
Ceil
更改时间戳时区
字符逐个翻译字符串
分块字符串
密码解密
加密算法
密码哈希
清理字符串
收集数组
收集不同的数组
压缩一组H3索引
拼接字符串
构建 GeoPoint 列
构建委托媒体 Gotham 标识符 (GID)
将DMS转换为GeoPoint
将 GeoPoint 转换为 Geohash
将GeoPoint转换为MGRS
将 GeoPoint 转换为几何
将 MGRS 转换为 GeoPoint
将字符串转换为日期
将字符串转换为时间戳
进制转换
转换角度单位
在距离单位之间转换
时间单位转换
在重量单位之间转换
转换数据为JSON
从Ontology GeoPoint转换
从十六进制转换
从十六进制转换为字符串
将地心坐标转换为WGS 84大地坐标
转换旧版 OffsetDateTime
将线串转换为多边形
从UTC转换时间戳
将时间戳转换为UTC
转换为 Ontology GeoPoint
转换为十六进制
转换为八进制
Cosine
协方差
从坐标系统创建GeoPoint
创建一个空数组
创建数组
创建椭圆几何形状
创建大地线字符串
创建线段几何
从数组创建映射
创建空值
创建范围扇形几何图形
从有序的GeoPoints行创建简单几何图形
创建结构体列
创建时间序列参考值
当前日期
当前时间戳
日期序列
解码 Geobuf 为 GeoJSON
Dense rank
唯一计数
数字除法
将GeoJSON编码为Geobuf
以...结尾
Epoch 毫秒到日期
从纪元毫秒转换为时间戳
Epoch秒数到日期
从纪元秒到时间戳
等于
拆分数组
位置展开数组
展开映射
指数
提取所有正则表达式匹配项
提取日期部分
提取文档元数据
提取图像元数据
提取映射键
提取映射值
从PDF中提取文本
从PDF提取文本(使用OCR)
从图像中提取文本(使用OCR)
提取时间戳部分
筛选数组元素
以几何类型筛选
First
第一个非空值 (合并)
Floor
将日期格式化为字符串
数字格式化
格式化字符串
将时间戳格式化为字符串
几何图形相交
三维几何仿射变换
几何数组(单一)合并
几何数组线合并
几何缓冲区
几何中心
几何包含
几何差异
几何图形分解为数组
几何交集
几何长度
几何旋转2D
几何设置z坐标
几何最短距离
几何标准化
几何对称差
几何变换表达式
几何联合
获取H3索引
获取覆盖几何图形的H3索引
获取信封的XZ曲线索引
从起点到终点的方位角计算
获取几何包络
获取纬度/经度边界框结构
获取H3索引的邻居
获取结构体字段
获取几何体的凸包
大于
大于或等于
Greatest
分组几何包络
分组几何联合
分组经纬度边界框
Gzip解压缩
H3单元到子单元
H3单元到父级
H3 转换为几何
哈希 sha256
在折线段上插值地理点
判断是否为NaN
是否为空结构
是否包含
Is not null
是否为空
是否有效的 GeoJSON
是否为有效的Geohash
是否为有效的H3索引
是否为有效的 MGRS
是否为有效MIME类型
是否为有效的Ontology GeoPoint
是有效的委托媒体 gid
是否为有效媒体引用
是否为有效的rid
是否是有效的uuid
合并数组
滞后
Last
一周/月/季度/年最后一天
Lead
Least
字符串的左侧
左填充字符串
长度
小于
小于或等于
Levenshtein距离
线性回归梯度
对数
以指定底数计算对数
逻辑类型转换
小写
映射值
最大值
平均值
Min
模式
Modulo
数字相乘
取反
正态随机数
Not
多边形中的第N链
线串中的第n个点
置空空字符串
或
PDF目录
从非WGS 84坐标系解析GeoJSON
解析分类字符串
解析持续时间
解析 json 为结构体
解析电话号码
将知名二进制解析为几何
解析知名文本为几何
解析 xml 作为模式
百分等级
周长
透视
正数模
幂函数
准备几何图形
产品
排名
缩减数组元素
正则表达式提取
正则表达式查找
Regex索引
正则表达式匹配
正则表达式替换
重命名结构字段
字符串右侧
右填充字符串
数字取整
行计数
行号
样本协方差
样本方差
正割
句子大小写
序列
简化几何
正弦
跳过字节
切片数组
拆分字符串
平方根
标准差
以...开头
分隔符后的字符串
分隔符前的字符串
字符串包含
子字符串
减去多个表达式
数字相减
减去时间戳/日期
从日期中减去值
求和
数组元素之和
正切
文本分割
文本到嵌入
时间戳添加
时间戳序列
时间戳减法
将时间戳转换为纪元毫秒
时间戳到纪元秒
标题大小写
使用CPU将音频转录为json
使用GPU将音频转录为json
将音频转录为文本
变换数组元素
变换映射键
变换映射值
删除空白字符
截断日期
截断时间戳
解压一组 H3 索引
Unicode 规范化
均匀随机数
全局唯一标识符 (uuid) (不稳定)
转为大写
Url 解码
Url 编码
使用LLM
从映射中获取值
方差
PB函数转换
聚合
条件下的聚合
窗口内聚合
反连接
应用表达式
数组元素到列
指派时间戳和水印
合并数据
如果表达式不存在则计算
将媒体集转换为表格行
笛卡尔积合并
日期分布
降维
删除列
删除重复项
空文件
空媒体集文件
空表
从数据集中提取文件元数据为行
提取多个结构字段
从CSV文件中提取行
从GeoJSON文件中提取行
从JSON文件中提取行
从电子邮件文件的数据集中提取行
从文本文件的数据集中提取行
从XML文件中提取行
从Excel文件中提取行
从 shapefile 中提取行
筛选
按名称首次合并
扁平化结构
频繁模式增长
地理距离内合并
地理距离左合并
地理交集内合并
地理交集左合并
GeoPoint-to-GeoPoint 3d距离内合并
几何交集合并
几何 knn 内部合并
几何 knn 左合并
获取媒体引用(数据集)
心跳检测
内连接
合并
K-means 聚类
保留重复项
键选择
左合并
左查找合并
手动输入表
映射合并
按名称缩小合并
标准化列名
数值分布
外部缓存合并
外部缓存合并
外部合并
透视表
项目
项目条件
窗口内的项目
重命名列
重新分区数据
汇总
行大小
选择列
半连接
排序
文本块
文本块
文本块
时间限制去重
有时间限制的乱序丢弃
有时间限制的事件时间排序
顶部行
变换媒体集
按名称合并
反透视
按名称宽合并
窗口
代码库
概述
导航
Configuration
在控制面板中配置代码库设置
代码库常见问题
Transforms
预览变换
调试变换
使用项目引用
分析更改的影响
单元测试
在平台内固定 Spark 模块
库
文档
Code Repositories 中的 AIP 功能
将数据集变换添加到Marketplace产品 [Beta]
Artifact Repositories
Artifact 存储库
导航
创建 Artifact 存储库
删除 Artifact 仓库
发布制品
召回制品
管理权限
Advanced workflows
创建自定义检查
准备数据集以供下载
Administer repositories
概述
分支设置
仓库设置
代码库升级
Spark 配置文件
工件设置
Ontology 导入
高级存储库设置
使用代码库计算用量
VS Code
VS Code Workspaces
故障排除
Visual Studio Code的Palantir扩展
Palantir扩展用于Visual Studio Code
功能列表: Visual Studio Code的Palantir扩展
变换搭建
计算模块
概述
计算模块使用和定价
在 Foundry 中创作计算模块
在本地开发环境中创建计算模块
创建Python计算模块
部署计算模块
数据谱系
概述
导航
数据沿袭问题
Graphs
探索数据沿袭
探索工件和Ontology实体
保存和分享图表
节点着色
图元素参考
Understand and manage datasets
预览和逻辑
查看搭建时间线
了解过时的数据集
查找具有指定列的数据集
搭建数据集
管理计划
Understand permissions
检查资源权限
查看权限标记更改的影响
数据健康
概述
搭建和检查常见问题解答
Health checks
检查类型
检查计划
监测检查
通知和问题
检查参考
Check groups
概述
创建和监视检查组
查看和理解检查组
将健康检查添加到Marketplace产品 [Beta]
数据集预览
数据集预览
CSV解析
SQL预览
数据集预览常见问题
Linter
概述
模式
建议
可用规则
扫描计划
影响跟踪
准备
准备
入门
创建一个简单的准备
项目引用
基本示例
高级示例
数据准备常见问题解答
配方
Recipes
核心概念
创建配方
查看所有Recipes
配置通知
编辑配方
转换
Python转换
概述
入门指南
Python版本支持
Basic transforms
变换和管道
项目结构
虚拟表概述
读取和写入非结构化文件
单元测试
调试
Incremental transforms
概述
增量变换参考
示例
中止事务
从快照创建历史数据集
Python environment
概览
环境创建概述
故障排查指南
Libraries
发现和使用 Python 库
共享Python库
设置 Python 本地开发
Accelerated Spark transforms
使用Velox加速Spark
Lightweight transforms
概述
轻量级变换API
轻量级变换示例
AIP
AIP 调度器
Palantir-provided models
在变换中使用Palantir提供的语言模型
Container transforms
概述
Spark 边车变换
Data expectations
开始
参考
读取存储库中的文件
输出列元数据
API Reference
变换 Python API
变换类
Foundry 连接器
使用媒体集与Python变换
PySpark Reference
概述
来自 Python
语法备忘单
风格指南
概念: 列
概念: 查询
概念: 用户定义函数
筛选
日期和时间戳
字符串
数学
合并
聚合和数据透视表
窗口
日志记录
其他
Java转换
概述
入门指南
Basic transforms
变换和管道
示例
读取和写入非结构化文件
单元测试
高级配置
增量变换
用户定义函数 (UDF)
在代码库之间共享代码
搭建 Java 本地开发环境
语法速查表
SQL转换
概述
Spark SQL 参考
R转换
概述
起始
常见转换
在本地开发中预览变换
变换版本
数据格式
时间序列
概述
概念词汇表
Time series setup
设置
创建或选择时间序列Object类型
时间序列属性 (TSPs)
时间序列同步
传感器对象类型设置
时间序列权限
高级设置
Derived series
派生序列
设置派生序列
手动保存派生序列至Ontology
管理派生序列
派生序列权限
常见问题
Using time series
在 Foundry 中使用时间序列
函数中的时间序列
在 FoundryTS 中使用时间序列
Time series property use case
概述
使用Pipeline Builder创建时间序列数据
使用 Ontology Manager 为 Object 添加时间序列属性
在 Workshop 模块和 Quiver 分析中使用时间序列属性
Sensor object types use case
概述
在Pipeline Builder中创建传感器对象类型数据
使用Ontology Manager创建传感器Object类型
在 Workshop 和 Quiver 中使用传感器对象类型的时间序列数据
时间序列查询计算使用
常见问题解答
地理空间
Foundry中的地理空间数据
地理空间数据的类型
坐标参考系统和投影
示例工作流
使用栅格数据
在变换中使用矢量数据
在Ontology中使用地理空间数据
将Ontology数据添加到Gaia
地理时间序列
概述
概念词汇表
数据建模
将地理时间序列与Ontology集成
常见问题
媒体集高级格式
添加DICOM媒体集
转录音频媒体集
Microsoft Excel
变换 Excel 解析器
用于Foundry数据集的S3兼容API
Hide sidebar
数据连接与集成
PB函数转换
从XML文件中提取行
注意:以下翻译的准确性尚未经过验证。这是使用
AIP ↗
从原始英文文本进行的机器翻译。
从XML文件中提取行
支持于: 批处理
读取一个文件数据集,并将每个XML文件解析为行。
变换类别
: 文件
声明的参数
数据集
- 要处理的文件数据集。
文件
模式
- 解析xml文件时使用的模式定义。
类型<Struct>
XML标签
- 用作每个标签生成一行的基础的XML标签。
字面值<字符串>
非必填
属性前缀
- 标签属性的前缀。
字面值<字符串>
非必填
编码
- 输入文件的编码类型(字符集)。
枚举<ISO_8859_1, UTF_8>
非必填
值标签
- 当元素中有属性而没有子元素时用于值的标签。
字面值<字符串>
←
PREVIOUS
从文本文件的数据集中提取行
NEXT
从Excel文件中提取行
→
Contents
从XML文件中提取行
声明的参数