核心概念

Sensitive Data Scanner 基于匹配条件、匹配操作和扫描的核心概念构建。扫描可以是一次性扫描或定期扫描。

匹配条件

匹配条件是 Sensitive Data Scanner 用于根据数据格式或值识别敏感数据的预定义模式。匹配条件有两种类型：

**正则表达式匹配条件：**通过正则表达式（regex）指定的匹配条件。正则表达式是一系列字符，代表匹配文本的模式。对于不熟悉正则表达式的用户，AIP 可以帮助创建匹配所需敏感数据的有效正则表达式。
**重叠匹配条件：**重叠匹配条件允许用户通过匹配现有 Foundry 数据集中已知包含此类数据的列中的值，来搜索预定义敏感数据的精确重复项（例如名称列表）。

创建匹配条件弹出窗口的截图，请求选择匹配条件类型

用户可以创建自己的自定义匹配条件，以涵盖他们关心的个人可识别信息（PII）类型。Sensitive Data Scanner 还提供了一系列预定义的内置匹配条件，以检测常见类型的 PII，如社会安全号码、电子邮件地址和电话号码。

匹配操作允许用户定义在平台内如何处理敏感数据的自动化操作。用户可以执行两种类型的匹配操作：

**创建问题：**用户可以设置匹配操作，以在发现匹配的列上创建问题，从而使治理团队能够手动审核和分类由 Sensitive Data Scanner 检测到的匹配项。
**应用权限标记：**用户可以将一个或多个权限标记应用于发现匹配的任何数据集，以确保访问控制。

选择匹配操作弹出窗口的截图

一次性敏感数据扫描根据匹配条件对用户选择的数据集进行单次搜索，并对任何匹配项执行指定的匹配操作。一次性扫描有助于识别 Foundry 中已经存在但不符合组织数据治理政策的数据。

定期敏感数据扫描类似于一次性扫描，不同之处在于定期扫描在用户选择的数据集添加新数据时进行。即使随着新数据的添加，定期扫描也能持续帮助识别潜在的不合规数据。