注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
是的。请查阅有关执行引擎的文档,以获取有关使用Spark引擎时Foundry对最终结果大小施加限制的信息,以及如何通过使用直接读取引擎来绕过这些限制。
在处理大型数据集时,请参考以下附加主题:
连接器提供了两种连接模式选项,可以在设置数据连接时指定。
在__导入模式__中,所选的表和列将被导入到Power BI®中。当您创建或与可视化互动时,Power BI®使用导入的数据。要查看自初始导入或最近刷新以来的基础数据更改,必须手动或通过计划刷新来刷新数据。
在__DirectQuery模式__中,数据不会被导入或复制到Power BI®中。当您创建或与可视化互动时,Power BI®将Foundry作为基础数据源进行查询,因此您始终在查看当前数据,并且可以将数据变换和筛选推回到Foundry层。
更广泛的使用建议
我们建议尽可能在导入模式下工作。如果数据较大,请考虑是否可以在导入之前在Foundry中减少数据大小,例如通过筛选不必要的行、删除列或在可能的情况下预聚合。这种Foundry预处理可以通过Foundry变换或Contour执行,并配置为自动搭建。或者,您可以考虑将表导入分成较小的块,以便在大小限制阈值内,例如每年导入一个数据集。
在DirectQuery模式下工作时,我们建议将仪表盘限制在相对较少的查询和简单的互动中。这种方法平衡了一方面利用DirectQuery处理非常大数据集的能力,另一方面是对最终用户关于性能的期望。
最后,考虑使用复合模型以实现处理非常大数据时的“兼顾两者”方法。使用复合模型,报告可以同时包含导入和DirectQuery数据连接。例如,您可以配置一个导入连接,预聚合或筛选概览和关键统计数据,在用户打开报告时提供快速加载时间。在同一个报告中,您还可以配置一个DirectQuery连接,以便于深入的按需分析。
使用Foundry Power BI®集成开发的报告将自动尊重报告开发者在Foundry中配置的访问权限。例如,在Power BI® Desktop中构建报告的开发者将仅能访问他通常在Foundry中可以访问的数据集或受限视图。
如果使用数据刷新,发布的报告将使用在Power BI®网关上配置的数据源的凭据,而不是继承报告消费者的任何凭据。
有关在网关上管理数据源的更多信息,请参阅Microsoft Power BI®文档中的管理数据源 - 导入/计划刷新。
Palantir的许多客户使用Power BI®服务更广泛地发布和分发报告。
为了在这些报告中利用Foundry集成,使用安装了Foundry连接器和ODBC驱动的Power BI®网关。在网关上创建连接时使用Foundry连接类型,将身份验证方法
设置为Key
,并提供为Foundry中的服务账户生成的词元。然后,网关将具有与Foundry的连接,可以由托管在Power BI®服务中的报告使用。
通过Power BI®网关使用Foundry连接器访问Foundry时,词元身份验证是唯一支持的身份验证方法。由于Power BI服务不提供此功能,因此不支持OAuth身份验证。如果您有需要OAuth身份验证的应用案例,请考虑在Power BI® Ideas ↗网站上添加反馈,并与您的Palantir和Microsoft代表分享反馈。
Foundry Power BI®集成与Power BI®网关的功能与您在Power BI® Desktop中习惯的方式相似。与您的Power BI®管理员合作,确保在网关上已完成安装。
Foundry Power BI®集成兼容Power BI®数据流,使用Power Query Online编辑器。
在开始之前,确保您可以访问已配置为与Foundry现有连接的本地网关。由于Power BI®服务的一个活动问题,目前不支持在数据流设置过程中创建新的网关连接。
要创建从Foundry提取数据的数据流,请按照以下步骤操作:
https://<subdomain>.palantirfoundry.com/
。可选地,提供数据集RID和分支。在数据流连接到数据源页面上,尝试创建新的本地网关连接时,您可能会收到以下错误信息:
Unexpected error (Session ID: <UUID>, Region: <REGION>)
在这里没有必要添加代码注释,因为这只是一个错误消息的输出模板,用于显示意外错误的会话ID和区域。 在数据流设置过程中,存在一个活动的 Power BI® 服务问题,阻止创建网关连接。要解决此问题,请在创建数据流之前,在您的网关上设置一个 Foundry 连接。在 Power BI® 服务中,您可以在 设置 > 管理连接和网关 > 连接 > 新建 中管理网关连接。
一旦您在网关上配置了一个可用的连接,当您提供匹配的 Base URL 时,数据流的 连接到数据源 页面将自动选择您的网关。
您可以将认证词元视为您自己的私人密码,授权 Power BI® 代表您访问 Foundry 数据。您可以在账户 → 设置 → 词元页面下管理现有词元并创建新词元,如生成词元的文档中所述。
如果您在尝试通过 OAuth 进行认证时遇到错误信息,可能是此功能尚未启用。您的错误信息可能类似于下图。要使用此功能,必须将 Power BI® 启用为第三方应用程序。管理第三方应用程序的安全文档详细说明了 Foundry 管理员如何启用此集成。
如果 OAuth 认证尚未启用,您可以继续通过替代的基于词元的认证选项进行连接。
如果您以前从 Power BI® 认证到 Foundry,现在想主动切换到使用基于词元的认证,您首先需要从 Power BI® 清除现有的凭据。
您可以按照无法连接中的说明清除现有凭据并重新认证。
如果您收到“无法连接”的信息,很可能是您的认证凭据已过期。请按照以下说明清除现有凭据并配置新的数据源。
可能存在关于您的认证凭据的问题,或者 Power BI® 可能想要求您运行查询的权限。在这种情况下,Power BI® 可能会静默失败并显示一个空白的报告页面,没有“应用更改”选项。在这种情况下,您应该点击“编辑查询”。它可以为您提供继续的选项。如果没有,请联系您的 Palantir 代表并分享错误信息。
通过“获取数据” → “Palantir Foundry”选择数据集时,您可能会注意到某些您在 Foundry 中有访问权限的表没有在文件夹导航器中显示。这发生在您有表的访问权限但没有父文件夹结构访问权限时。
只要您对该表在 Foundry 中有访问权限,您仍然可以将其导入 Power BI® 进行可视化。使用前一页中的非必填对话框指定“数据集 RID”。RID 是数据集的唯一标识符,即使您移动数据集,它也是稳定的。您可以通过导航到所需数据集的“关于”页面,点击“查看更多”并复制 RID 值在 Foundry 中找到正确的 RID。
请参阅有关在 Foundry 中查找数据集的 RID 或文件路径的详细说明指南:识别数据集的 RID 或文件路径
通常,表越大,导入处理的时间就越长。根据您的 Power BI® 订阅,“导入模式”在 Power BI® 中可能限制为 1GB。Palantir Foundry 连接器为 Power BI® 也设置了导入大小限制 - 详情请参阅我可以传输的数据量是否有大小限制?。
如果您的表导入由于表大小而失败或缓慢,请查看如何优化连接器在导入和 DirectQuery 模式下的使用?以获取有关使用大型数据集与连接器的提示。
如果您通过 Power BI® 中的表导航器选择数据集,您的数据源将依赖于该数据集存在于此位置。如果数据集在 Foundry 中被重命名或移动,这可能会导致数据刷新问题,因为 Power BI® 将不再能够找到数据集。
如果您预计数据集会移动,建议使用数据集 RID 配置数据源。有关通过 RID 配置数据源的详细信息,请参阅为什么我在表导航器中看不到我的表?。
Power BI® 和 Power BI® 徽标是微软公司集团的商标。