Python编辑距离

安装方法:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ python-Levenshtein
Github地址:https://github.com/ztane/python-Levenshtein
DOC地址:https://rawgit.com/ztane/python-Levenshtein/master/docs/Levenshtein.html

安装了python-Levenshtein之后就可以使用了:

使用方法

import Levenshtein

str1 = "Apple"
str2 = "application"

# 计算编辑距离,输出从一个字符串变为另一个字符串的最少操作次数。操作可以是插入、删除、替换
print(Levenshtein.distance(str1, str2))  # 8

# 计算莱文斯坦比
# 计算公式  r = (sum - ldist) / sum, 其中sum是指str1和str2字串的长度总和,ldist是类编辑距离
print(Levenshtein.ratio(str1, str2))  # 0.375
# 计算jaro距离
print(Levenshtein.jaro(str1, str2))  # 0.6242424242424242
# 计算Jaro–Winkler距离
print(Levenshtein.jaro_winkler(str1, str2))  # 0.6242424242424242

str3 = 'apply'
str4 = 'Apple'
# 计算汉明距离,要求str3和str4必须长度一致。输出两个等长字串对应位置上不同字符的个数
print(Levenshtein.hamming(str3, str4))  # 2
上一篇:编辑距离4:Damerau–Levenshtein distance


下一篇:PHP levenshtein() 函数