词性 ,指以词的特点作为划分词类的根据,主要用来描述一个词在上下文中的作用。中文常见的有,a形容词,d副词,n名词等等。
1 import jieba.posseg as pseg
2 words = pseg.cut("我爱自然语言处理")
3 for word, flag in words:
4 print('%s %s' % (word, flag))
当获得到词性时,我们就可以根据词性进行筛选。
1 import jieba.posseg as pseg
2 words = pseg.cut("我爱自然语言处理")
3 lst = [x.word for x in words if x,flag == 'v']
4 print(lst)
>>>['爱','处理']