安装方法:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ python-Levenshtein
Github地址:https://github.com/ztane/python-Levenshtein
DOC地址:https://rawgit.com/ztane/python-Levenshtein/master/docs/Levenshtein.html
安装了python-Levenshtein
之后就可以使用了:
使用方法
import Levenshtein
str1 = "Apple"
str2 = "application"
# 计算编辑距离,输出从一个字符串变为另一个字符串的最少操作次数。操作可以是插入、删除、替换
print(Levenshtein.distance(str1, str2)) # 8
# 计算莱文斯坦比
# 计算公式 r = (sum - ldist) / sum, 其中sum是指str1和str2字串的长度总和,ldist是类编辑距离
print(Levenshtein.ratio(str1, str2)) # 0.375
# 计算jaro距离
print(Levenshtein.jaro(str1, str2)) # 0.6242424242424242
# 计算Jaro–Winkler距离
print(Levenshtein.jaro_winkler(str1, str2)) # 0.6242424242424242
str3 = 'apply'
str4 = 'Apple'
# 计算汉明距离,要求str3和str4必须长度一致。输出两个等长字串对应位置上不同字符的个数
print(Levenshtein.hamming(str3, str4)) # 2