原文: http://106.13.73.98/__/131/
安装:pip install jieba
jieba
模块用于将一句或多句话按词组分割为列表.
如下示例:
import jieba
"""cut"""
s = '我就喜欢写代码'
res01 = list(jieba.cut(s))
# ['我', '就', '喜欢', '写', '代码']
# 还可以添加词组:
jieba.add_word('写代码')
res02 = list(jieba.cut(s))
# 添加词组后的结果:
# ['我', '就', '喜欢', '写代码']
"""cut_for_search"""
# cut_for_search方法适用于搜索引擎构建倒排索引的分词,力度比较细
s = '人如果没有梦想,那跟咸鱼有什么区别呢?'
# 添加词组
jieba.add_word('有什么')
res03 = list(jieba.cut_for_search(s))
# 添加词组后,使用cut_for_search的结果:
# ['人', '如果', '没有', '梦想', ',', '那', '跟', '咸鱼', '什么', '有什么', '区别', '呢', '?']
原文: http://106.13.73.98/__/131/