注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
Slack连接器处于测试阶段,可能无法在您的Foundry注册中使用。如果您在数据连接的新来源页面找不到Slack,请联系Palantir支持以启用访问。
使用CData JDBC驱动将Foundry连接到Slack,以将数据导入Foundry数据集。
功能 | 状态 |
---|---|
批量导入 | 🟡 测试版 |
探索 | 🟡 测试版 |
增量 | 🟡 测试版 |
CData驱动将Slack数据建模为关系数据库中的表列表,可以使用标准SQL语句查询。有关可用表及其内容的信息,请查看CData文档中的Slack表 ↗。
了解有关在Foundry中设置连接器的更多信息。
对Slack的身份验证是通过Bearer词元进行的。这可以通过与您Slack工作区中安装的Slack应用程序关联的机器人用户词元提供。
使用机器人词元可以创建持久且稳健的来源,而无需直接链接到个人用户。要创建Slack应用程序并获取其机器人词元,请按照Slack文档中的步骤操作:
要摄取数据表,必须为在来源配置的凭据设置中配置的Bearer词元的Slack应用程序授予特定的Slack权限范围。
有关支持所有CData驱动功能所需的权限范围的完整列表,请参阅CData文档 ↗。当仅使用Slack连接器进行数据摄取功能时,不需要写入权限范围。有关权限范围的更多详细信息,请查看Slack文档 ↗。
用于数据摄取的Slack应用程序的权限范围要求可以减少,如果仅需要这些表中的特定数据表或类型的Slack频道数据进行摄取。
示例:用于摄取与Slack消息和频道类型相关的数据表的权限范围要求包括以下内容:
表名 | 范围 | 总是需要吗? | 描述 |
---|---|---|---|
Users | users:read | 是 | 加载用户。 |
Channels | channels:read , groups:read , im:read , mpim:read | 否 | 仅在分别加载公共、私人、im(直接消息)或mpim(群组直接消息)频道时需要。加载所有频道类型时(如果没有指定频道筛选,这就是默认设置)需要所有权限。 |
Messages 或 MessageReplies | channels:history , groups:history , im:history , mpim:history + Channels 的要求 | 否 | 仅在分别从公共、私人、im或mpim频道加载消息/回复时需要。加载所有频道类型时(如果没有指定频道筛选,这就是默认设置)需要所有权限。另见下面关于频道成员资格要求的附加说明。 |
要使用Slack连接器的Slack应用程序的机器人词元从给定的Slack频道摄取消息和消息回复,必须首先将Slack应用程序添加到Slack频道中,并且如上所述具有频道类型的读取权限范围。 Slack应用程序可以由用户手动添加到Slack中的频道,也可以使用应用程序的机器人用户词元通过Slack Web API ↗以编程方式加入公共频道。
Slack连接器需要对slack.com
的网络访问,端口为443
。如果您正在通过互联网使用直接连接,请确保存在出口策略。
对于代理运行时,运行代理的服务器必须能够访问该域。
Slack连接器可用的配置选项如下:
选项 | 必需吗? | 描述 |
---|---|---|
凭据设置 | 是 | 使用上面显示的身份验证指南进行配置。 |
代理设置 | 否 | 启用并输入用户名和密码以允许通过代理连接到Slack。 |
日志 | 否 | 启用以控制连接器如何记录信息。有关更多详细信息,请查看日志设置部分。 |
要设置Slack同步,请在来源概览屏幕的右上角选择探索和创建同步。接下来,选择要同步到Foundry的表。当您准备好同步时,选择为x个数据集创建同步。
Slack连接器允许进行高级同步配置,以确定将哪些数据量引入Foundry。
在探索可用的同步并将其添加到连接器后,导航到编辑同步。从左侧的同步面板中,找到您要配置的同步并选择右侧的**>**。
选项 | 必需吗? | 描述 |
---|---|---|
表 | 是 | 选择要从Slack复制到Foundry的表。请参阅数据模型了解支持哪些表。 |
列选择 | 否 | 选择要同步到Foundry的列子集。有关更多信息,请查看列选择部分。 |
行筛选 | 否 | 启用并添加筛选以删除不符合其列值标准的行。有关更多信息,请查看行筛选部分。 |
限制 | 否 | 向底层查询添加SQL limit 子句。此设置可用于限制在一次运行中同步到Foundry的行数。 |
增量 | 否 | 启用以小批量将数据同步到Foundry。有关更多信息,请查看增量部分。 |
通常,同步将从目标表导入所有匹配的行,无论同步之间数据是否更改。相比之下,增量同步会维护最近一次同步的状态,仅摄取目标中的新匹配行。
在从Slack摄取大表时,可以使用增量同步。要使用增量同步,表必须包含一个严格单调递增的列。此外,读取的表必须包含一个具有以下数据类型之一的列:
DATE
TIMESTAMP
数值列类型:
int
TINYINT
SMALLINT
INTEGER
long
BIGINT
NUMERIC
NUMBER
DECIMAL
DEC
字符串列类型:
string
VARCHAR
CHAR
NVARCHAR
NCHAR
LONGNVARCHAR
LONGVARCHAR
增量同步需要以下配置:
选项 | 必需吗? | 描述 |
---|---|---|
列 | 是 | 选择将被用于增量摄取的列。如果表不包含任何支持的列类型,下拉菜单将为空。 |
初始值 | 是 | 起始同步数据的值。 |
示例同步配置:
Messages
表包含配置的Bearer词元有权访问的每个频道的所有非线程回复消息。CreatedTime
时间戳列。CreatedTime
列作为增量列进行追加事务同步来摄取新消息,并指定起始时间戳值以开始读取消息。CreatedTime
时间戳或之后的消息。MessageReplies
表中同步线程消息回复,使用其CreatedTime
时间戳列。选择要同步到Foundry的列。如果未选择任何列,所有列将同步到Foundry。
所有列名必须以下划线或英文字母开头。名称只能包含下划线、英文字母或数字。
以下示例是有效的列名:
_colum_name
a_column_name_123
以下示例是无效的列名:
1ColumnName
; 以数字开头。a-column-name*
; 包含连字符和星号。å-column-name
; 包含非英文字母。可以添加筛选以减少同步行数或单独选择将同步到Foundry的行。要配置行筛选,表的预览必须成功。在配置行筛选之前,我们建议使用界面底部的入站数据预览
部分刷新预览。可以刷新预览以验证添加的筛选的行为。
筛选配置由一组条件组成,每行必须通过这些条件才能同步到Foundry。每组条件可以评估为匹配所有
条件匹配或至少一个
条件匹配。条件组可以嵌套,以提供更细粒度的控制以决定导入什么并提供高度的灵活性。这些等价于标准SQL中的AND
和OR
语句。
条件本身是对Slack表中列的值与可以在界面中输入的值的简单比较。例如,条件CreatedAt
等于12/04/2021
将只导入CreatedAt
列中值为12/04/2021
的行。列的数据类型决定了支持的比较操作。
筛选中支持以下操作:
等于
大于
小于
大于或等于
小于或等于
不等于
为空
不为空
这些比较操作的行为与标准SQL中的操作行为相同。
字符串类型列还支持使用标准SQL-92语法的Like
和Not like
操作符。