注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。

频繁模式增长

支持于: 批处理

频繁模式(fp)增长在您的数据集中查找频繁模式。

变换类别: 聚合, 其他

声明的参数

  • 输入数据集 - 包含项目列和事务列的源数据集。
    表格
  • 项目列 - 包含模式项目的数组列。
    列<数组<字符串>>
  • 最小支持度 - 模式需要出现的最小频率。
    字面值<双精度>

示例

示例 1: 基本情况

参数值:

  • 输入数据集: ri.foundry.main.dataset.a
  • 项目列: customer_attributes
  • 最小支持度: 0.6

输入:

customer_attributes
[ age_group: 20-30, country: Germany, gender: Female ]
[ age_group: 20-30, country: Germany, gender: Male ]

输出:

patternpattern_occurrencetotal_count
[ country: Germany, age_group: 20-30 ]22
[ age_group: 20-30 ]22
[ country: Germany ]22

示例 2: 空情况

参数值:

  • 输入数据集: ri.foundry.main.dataset.a
  • 项目列: customer_attributes
  • 最小支持度: 0.0

输入:

customer_attributes
null

输出:

patternpattern_occurrencetotal_count

示例 3: 空情况

参数值:

  • 输入数据集: ri.foundry.main.dataset.a
  • 项目列: customer_attributes
  • 最小支持度: 0.0

输入:

customer_attributes
[ age_group: 20-30, country: Germany, gender: Female ]
[ null ]

输出:

patternpattern_occurrencetotal_count
[ country: Germany ]12
[ country: Germany, age_group: 20-30 ]12
[ null ]12
[ age_group: 20-30 ]12
[ gender: Female ]12
[ gender: Female, country: Germany ]12
[ gender: Female, country: Germany, age_group: 20-30 ]12
[ gender: Female, age_group: 20-30 ]12

示例 4: 边缘情况

参数值:

  • 输入数据集: ri.foundry.main.dataset.a
  • 项目列: customer_attributes
  • 最小支持度: 0.0

输入:

customer_attributes
[ age_group: 20-30, country: Germany, gender: Female ]
[ age_group: 20-30, country: Germany, gender: Male ]

输出:

patternpattern_occurrencetotal_count
[ gender: Male ]12
[ gender: Male, country: Germany ]12
[ gender: Male, country: Germany, age_group: 20-30 ]12
[ gender: Male, age_group: 20-30 ]12
[ age_group: 20-30 ]22
[ country: Germany ]22
[ country: Germany, age_group: 20-30 ]22
[ gender: Female ]12
[ gender: Female, country: Germany ]12
[ gender: Female, country: Germany, age_group: 20-30 ]12
[ gender: Female, age_group: 20-30 ]12