Python 基础 jieba库——词性标注与筛选

词性 ,指以词的特点作为划分词类的根据,主要用来描述一个词在上下文中的作用。中文常见的有,a形容词,d副词,n名词等等。

1 import jieba.posseg as pseg
2 words = pseg.cut("我爱自然语言处理")
3 for word, flag in words:
4     print('%s %s' % (word, flag))

Python 基础 jieba库——词性标注与筛选
当获得到词性时,我们就可以根据词性进行筛选。

1 import jieba.posseg as pseg
2 words = pseg.cut("我爱自然语言处理")
3 lst = [x.word for x in words if x,flag == 'v']
4 print(lst)
>>>['爱','处理']
上一篇:python可视化文本分析(2)—snownlp+jieba分析QQ群成员发言情况


下一篇:jieba 库(网上) 和 wordcloud 库 巩固