注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

Slack [Beta]

Slack连接器处于测试阶段,可能无法在您的Foundry注册中使用。如果您在数据连接的新来源页面找不到Slack,请联系Palantir支持以启用访问。

使用CData JDBC驱动将Foundry连接到Slack,以将数据导入Foundry数据集。

支持的功能

功能状态
批量导入🟡 测试版
探索🟡 测试版
增量🟡 测试版

数据模型

CData驱动将Slack数据建模为关系数据库中的表列表,可以使用标准SQL语句查询。有关可用表及其内容的信息,请查看CData文档中的Slack表 ↗

设置

  1. 打开数据连接应用程序,并在屏幕右上角选择**+ 新来源**。
  2. 从可用连接器类型中选择Slack
  3. 选择通过互联网使用直接连接或通过中介代理连接通过代理
  4. 按照下面各部分中的信息继续设置连接器的其他配置提示。

了解有关在Foundry中设置连接器的更多信息。

身份验证

对Slack的身份验证是通过Bearer词元进行的。这可以通过与您Slack工作区中安装的Slack应用程序关联的机器人用户词元提供。

使用机器人词元可以创建持久且稳健的来源,而无需直接链接到个人用户。要创建Slack应用程序并获取其机器人词元,请按照Slack文档中的步骤操作:

权限

要摄取数据表,必须为在来源配置凭据设置中配置的Bearer词元的Slack应用程序授予特定的Slack权限范围。

有关支持所有CData驱动功能所需的权限范围的完整列表,请参阅CData文档 ↗。当仅使用Slack连接器进行数据摄取功能时,不需要写入权限范围。有关权限范围的更多详细信息,请查看Slack文档 ↗

用于数据摄取的Slack应用程序的权限范围要求可以减少,如果仅需要这些表中的特定数据表或类型的Slack频道数据进行摄取。

示例:用于摄取与Slack消息和频道类型相关的数据表的权限范围要求包括以下内容:

表名范围总是需要吗?描述
Usersusers:read加载用户。
Channelschannels:read, groups:read, im:read, mpim:read仅在分别加载公共、私人、im(直接消息)或mpim(群组直接消息)频道时需要。加载所有频道类型时(如果没有指定频道筛选,这就是默认设置)需要所有权限。
MessagesMessageReplieschannels:history, groups:history, im:history, mpim:history + Channels的要求仅在分别从公共、私人、im或mpim频道加载消息/回复时需要。加载所有频道类型时(如果没有指定频道筛选,这就是默认设置)需要所有权限。另见下面关于频道成员资格要求的附加说明。

要使用Slack连接器的Slack应用程序的机器人词元从给定的Slack频道摄取消息和消息回复,必须首先将Slack应用程序添加到Slack频道中,并且如上所述具有频道类型的读取权限范围。 Slack应用程序可以由用户手动添加到Slack中的频道,也可以使用应用程序的机器人用户词元通过Slack Web API ↗以编程方式加入公共频道。

网络

Slack连接器需要对slack.com的网络访问,端口为443。如果您正在通过互联网使用直接连接,请确保存在出口策略。 对于代理运行时,运行代理的服务器必须能够访问该域。

配置选项

Slack连接器可用的配置选项如下:

选项必需吗?描述
凭据设置使用上面显示的身份验证指南进行配置。
代理设置启用并输入用户名和密码以允许通过代理连接到Slack。
日志启用以控制连接器如何记录信息。有关更多详细信息,请查看日志设置部分。

从Slack同步数据

要设置Slack同步,请在来源概览屏幕的右上角选择探索和创建同步。接下来,选择要同步到Foundry的表。当您准备好同步时,选择为x个数据集创建同步

了解有关在Foundry中进行来源探索的更多信息。

配置Slack同步

Slack连接器允许进行高级同步配置,以确定将哪些数据量引入Foundry。

在探索可用的同步并将其添加到连接器后,导航到编辑同步。从左侧的同步面板中,找到您要配置的同步并选择右侧的**>**。

选项必需吗?描述
选择要从Slack复制到Foundry的表。请参阅数据模型了解支持哪些表。
列选择选择要同步到Foundry的列子集。有关更多信息,请查看列选择部分。
行筛选启用并添加筛选以删除不符合其列值标准的行。有关更多信息,请查看行筛选部分。
限制向底层查询添加SQL limit子句。此设置可用于限制在一次运行中同步到Foundry的行数。
增量启用以小批量将数据同步到Foundry。有关更多信息,请查看增量部分。

增量

通常,同步将从目标表导入所有匹配的行,无论同步之间数据是否更改。相比之下,增量同步会维护最近一次同步的状态,仅摄取目标中的新匹配行。

在从Slack摄取大表时,可以使用增量同步。要使用增量同步,表必须包含一个严格单调递增的列。此外,读取的表必须包含一个具有以下数据类型之一的列:

  • DATE
  • TIMESTAMP

数值列类型:

  • int
  • TINYINT
  • SMALLINT
  • INTEGER
  • long
  • BIGINT
  • NUMERIC
  • NUMBER
  • DECIMAL
  • DEC

字符串列类型:

  • string
  • VARCHAR
  • CHAR
  • NVARCHAR
  • NCHAR
  • LONGNVARCHAR
  • LONGVARCHAR

增量同步需要以下配置:

选项必需吗?描述
选择将被用于增量摄取的列。如果表不包含任何支持的列类型,下拉菜单将为空。
初始值起始同步数据的值。

示例同步配置:

  • Messages表包含配置的Bearer词元有权访问的每个频道的所有非线程回复消息。
  • 表具有用于消息创建时间戳的CreatedTime时间戳列。
  • 同步可以配置为仅使用CreatedTime列作为增量列进行追加事务同步来摄取新消息,并指定起始时间戳值以开始读取消息。
  • 当初始同步运行时,将摄取在起始时间戳或之后创建的所有消息。
  • 在下次同步时,仅摄取自上次同步以来创建的CreatedTime时间戳或之后的消息。
  • 类似的增量同步配置可以用于从MessageReplies表中同步线程消息回复,使用其CreatedTime时间戳列。

列选择

选择要同步到Foundry的列。如果未选择任何列,所有列将同步到Foundry。

所有列名必须以下划线或英文字母开头。名称只能包含下划线、英文字母或数字。

以下示例是有效的列名:

  • _colum_name
  • a_column_name_123

以下示例是无效的列名:

  • 1ColumnName; 以数字开头。
  • a-column-name*; 包含连字符和星号。
  • å-column-name; 包含非英文字母。

行筛选

可以添加筛选以减少同步行数或单独选择将同步到Foundry的行。要配置行筛选,表的预览必须成功。在配置行筛选之前,我们建议使用界面底部的入站数据预览部分刷新预览。可以刷新预览以验证添加的筛选的行为。

筛选配置由一组条件组成,每行必须通过这些条件才能同步到Foundry。每组条件可以评估为匹配所有条件匹配或至少一个条件匹配。条件组可以嵌套,以提供更细粒度的控制以决定导入什么并提供高度的灵活性。这些等价于标准SQL中的ANDOR语句。

条件本身是对Slack表中列的值与可以在界面中输入的值的简单比较。例如,条件CreatedAt等于12/04/2021将只导入CreatedAt列中值为12/04/2021的行。列的数据类型决定了支持的比较操作。

比较操作

筛选中支持以下操作:

  • 等于
  • 大于
  • 小于
  • 大于或等于
  • 小于或等于
  • 不等于
  • 为空
  • 不为空

这些比较操作的行为与标准SQL中的操作行为相同。

字符串类型列还支持使用标准SQL-92语法的LikeNot like操作符。