注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

从Excel文件中提取行

支持于: 批处理

读取一组Excel文件的数据集,并将每个文件解析为行。支持的文件格式:.xls, .xlt, .xltm, .xltx, .xlsx, .xlsm。

变换类别: 文件

声明的参数

  • 数据集 - 要处理的文件数据集。
    Files
  • 要跳过的行数 - 每个工作表开头要跳过的行数。如果您不使用“将第一行(跳过后)视为标题”选项且存在标题,则此值应包括标题行。
    Literal<Integer>
  • 模式 - 与匹配指定模式的工作表中的数据相对应的列名称的有序列表。
    List<Literal<字符串>>
  • 源工作表模式 - 将从名称包含与此正则表达式匹配的子字符串的所有工作表中提取数据。如果您指定空字符串(此参数的默认值),将从所有工作表中提取数据。要进行完整字符串匹配而不是子字符串匹配,您可以在字符串的开头添加^,在结尾添加$。
    Literal<字符串>
  • 非必填 输出列用于存放文件路径 - 如果存在,将创建一个具有此列名的输出列,其中包含解析文件的路径。
    Literal<字符串>
  • 非必填 输出列用于存放工作表名称 - 如果存在,将创建一个具有此列名的输出列,其中包含解析行的工作表名称。
    Literal<字符串>
  • 非必填 将第一行(跳过后)视为标题 - 如果为true,每个工作表中跳过后的第一行将被视为标题,并且该标题中字段的顺序将用于确定工作表中的列与模式中的列之间的映射。字段的顺序在不同的工作表(和文件)之间可能不同,模式中指定的所有字段不必在所有工作表中都存在,Excel工作表中存在的所有字段也不必都包含在模式中。标题行的单元格值中存在的字符串将在应用以下清理步骤后不区分大小写地映射到模式列名:
  1. 如果存在,删除任何字符组合 (),;{}\n\t=的字符串初始序列(此列表中的第一个字符是ASCII空格)。
  2. 将所有剩余的 (),;{}\n\t=实例替换为下划线。
  3. 将所有连续的下划线替换为一个下划线。
  4. 如果字符串现在以一个下划线结尾,删除该下划线。
    Literal<Boolean>