注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
连接到 SharePoint Online,以从指定的 SharePoint 库中导入文件到 Foundry。
功能 | 状态 |
---|---|
探索 | 🟢 一般可用 |
批量导入 | 🟢 一般可用 |
增量 | 🟢 一般可用 |
导出任务 | 🟡 停用 |
文件导出 | 🟢 一般可用 |
连接器可以将任何类型的文件传输到 Foundry 数据集。文件格式会被保留,传输过程中或之后不会应用任何模式。对输出数据集应用任何必要的模式,或编写下游变换以访问数据。
可传输文件的大小没有限制。然而,网络问题可能导致大规模传输失败。特别是,运行超过两天的直接云同步将被中断。为避免网络问题,我们建议使用较小的文件大小,并限制每次执行同步时摄取的文件数量。同步可以定期安排运行。
不支持连接到本地 SharePoint 服务器。
了解更多关于在 Foundry 中设置连接器的信息。
SharePoint Online 来源的认证需要在 Microsoft Entra ID(以前称为 Azure Active Directory)中创建一个应用程序。如果您不是 Entra ID 管理员,请联系您的 IT 部门请求访问。
按照以下初始步骤访问 Azure 应用程序凭据:
然后,从以下两种可用的认证方法中选择:
在您的 Microsoft Entra 管理中心,完成以下步骤:
在左侧边栏中进入 API 权限。
选择 添加权限。
选择 Microsoft Graph。
选择 应用程序权限。
Sites.Read.All
。
Sites.ReadWrite.All
。Sites.Selected
。如果您是 Entra 管理员,选择 授予 [租户] 的管理员同意。
如果您在上面添加了 Sites.Selected
,将您的应用程序添加到特定站点 ↗。
"roles"
数组参数的可用选项为 "write"
和/或 "read"
。选项 "read"
足以从 SharePoint 站点摄取文件。https://graph.microsoft.com/v1.0/sites/[tenantName]:/sites/[siteName]
可以接收有关站点的元数据(例如:https://graph.microsoft.com/v1.0/sites/contoso.sharepoint.com:/sites/mySite)。此请求将返回一个 ID,该 ID 是几个值的组合:站点集合主机名、站点集合唯一 ID 和站点唯一 ID,其中中间值是运行权限 POST 所需的 siteId。在数据连接中设置以下源配置:
选项 | 必填? | 描述 |
---|---|---|
Azure 客户端 ID | 是 | 应用程序注册的 ID;也称为应用程序 ID。 |
Azure 租户 ID | 是 | Microsoft Entra ID 实例的唯一标识符。 |
客户端机密 | 是 | 应用程序注册中生成的机密。 |
用户名/密码流程涉及创建一个可以登录到 Microsoft 365 的用户帐户。Graph API 不支持用户名/密码认证方法的双因素认证。因此,我们强烈建议创建至少 32 个字符长度的随机生成密码。
在您的 Entra 管理中心,完成以下步骤:
Sites.Read.All
权限;
Sites.ReadWrite.All
。是
。在数据连接中设置以下源配置:
选项 | 必填? | 描述 |
---|---|---|
Azure 客户端 ID | 是 | 应用程序注册的 ID;也称为应用程序 ID。 |
用户名 | 是 | 用户的电子邮件地址。 |
密码 | 是 | 生成的密码。 |
如果您正在使用 SharePoint 加载项进行授权和认证 ↗,且您的 SharePoint 加载项使用 XML 进行权限管理,您必须确保在范围 URI 中设置了正确的范围,以避免连接到 SharePoint 时的访问问题。
请按照以下步骤验证和配置正确的范围:
AppManifest.xml
文件。AppManifest.xml
文件中,识别 XML 文件中的范围 URI,应该类似于以下内容:<AppPermissionRequests AllowAppOnlyPolicy="true"> <AppPermissionRequest Scope="http://sharepoint/content/sitecollection/web" Right="FullControl" /> </AppPermissionRequests>
。
http://sharepoint/content/sitecollection/web
)是否与您正在连接的 SharePoint 站点匹配;如果范围值不匹配,请相应调整范围值。SharePoint Online 连接器需要在端口 443 上访问以下域:
login.microsoftonline.com
graph.microsoft.com
contoso.sharepoint.com
如果您使用的是 GovCloud Sharepoint 实例,请改用以下域名在端口 443 上:
login.microsoftonline.us
graph.microsoft.us
contoso.sharepoint.us
以下是 SharePoint Online 连接器的配置选项:
选项 | 必填? | 描述 |
---|---|---|
SharePoint 库 URL | 是 | 单个 SharePoint 站点可能有多个文档库;您的 URL 必须指向特定的库。必须采用格式 https://[tenant].sharepoint.com/sites/[site]/[library] 。 |
凭证设置 | 是 | 使用上面显示的认证指南进行配置。 |
代理设置 | 否 | 启用以在连接 SharePoint Online 时使用代理。 |
SharePoint Online 连接器使用基于文件的同步接口。
要导出到 SharePoint 站点,首先为您的 SharePoint Online 连接器启用导出。然后,创建一个新的导出。
选项 | 必填? | 默认值 | 描述 |
---|---|---|---|
目录路径 | 是 | / | SharePoint 库中应导出文件的文件夹路径。导出文件的完整路径计算为 <SharePoint Library URL>/Directory Path>/<Exported File Path> |