python使用jieba库实现关键词提取的方法主要分为两种:
第一种,使用extract_tags方法:
keywords = jieba.analyse.extract_tags(text, topK=5)
第二种,使用textrank方法:
keywords = jieba.analyse.textrank(text, topK=5)
其中text为与分析的文本,topK为输出的关键词数量
具体代码如下:
import jieba.analyse def analyse(text, id): # kwords = jieba.analyse.extract_tags(text, topK=5) # print(kwords) keywords = jieba.analyse.textrank(text, topK=5) keys = '' for keyword in keywords: keys += keyword + ' ' try: updatekeyword(keys, id) print('更新成功',id,keys) except: print('更新失败',id) if __name__ == '__main__': texts = selectintroduction()//该处我读取的数据库数据 for text in texts: try: analyse(text['introduction'],text['id']) except: print('Error!')