+
K
注意:以下翻译的准确性尚未经过验证。这是使用 AIP ↗ 从原始英文文本进行的机器翻译。
如何在 PySpark 中使用语音代码对实体名称进行模糊匹配?
此代码使用 PySpark 清洗实体名称,生成语音代码,并使用 Jaro 相似性指标对实体名称进行模糊匹配。这对于在两个数据集中匹配相似的实体名称非常有用。
pyspark
模糊匹配
语音编码
jaro相似度