在做搜索员工的服务时,用户会输出英文名和工号,例如emma0012,这个时候使用jiaba分词不能把名字和工号分开,不能匹配不同的字段,所以在分词后使用分组函数特殊处理一下
from itertools import groupby
word = 'emma0012'
for k, g in groupby(word, key=lambda x: x.isdigit()):
words.append(''.join(list(g)))
2024-03-03 18:43:34
在做搜索员工的服务时,用户会输出英文名和工号,例如emma0012,这个时候使用jiaba分词不能把名字和工号分开,不能匹配不同的字段,所以在分词后使用分组函数特殊处理一下
from itertools import groupby
word = 'emma0012'
for k, g in groupby(word, key=lambda x: x.isdigit()):
words.append(''.join(list(g)))