注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

转录音频媒体集

本指南将介绍如何在Foundry中使用媒体集进行音频转录。

第1部分:在Foundry中将音频文件导入为媒体集

首先,您应将音频文件导入为媒体集。有两种方法可以实现:

导入后,您将能够查看音频媒体集。

音频媒体集

第2部分:通过Pipeline Builder转录音频媒体集

  1. 在Pipeline Builder中创建一个新的管道。详细步骤可以在Pipeline Builder文档的初始设置部分中找到。

  2. 将您的音频媒体集添加到管道中。

    将音频媒体集添加到Pipeline Builder。

    您导入的音频媒体集应如下所示:

    已导入的音频媒体集。

  3. 使用变换将媒体集转换为表格行。

    将音频媒体集转换为表格行。

    这将为您的媒体集中的项目生成媒体引用。媒体引用使您能够在Foundry中使用媒体项目,而无需复制该媒体项目本身。了解更多关于媒体引用的信息

  4. 接下来,选择将音频转录为文本变换。

    将音频转录为文本变换。

  5. 指定将音频转录为文本变换的输入,并选择应用

    变换的示例输入。 使用步骤3中生成的mediaReference,并选择所需的语言。如果未提供语言,将从音频的前30秒推断。

  6. 您可以在表格中预览转录输出。

    预览音频转录输出。

  7. 如果需要,您可以继续使用可用的字符串变换来变换您的音频转录字符串输出。

第3部分:保存管道输出

选择所需的管道输出。您可以输出为数据集或选择通过选择对象类型输出来对输出进行本体化。创建对象类型将允许您在Workshop中使用您的管道输出。

了解更多关于如何保存您的管道输出