# 前提是必须安装: python -m spacy download en
nlp = spacy.load('en')
text = u"you are best. it is lemmatize test for spacy. I love these books. amines (when protonated)"
doc = nlp(text)
# 观察分词
token = [t for t in doc]
# 分词我们就用这个orth_ 可以识别标点符号
token2 = [token.orth_ for token in doc]
# 观察词干化
lemma = [l.lemma_ for l in doc]
# 词性标注
pos = [p.pos_ for p in doc]
相关文章
- 03-04数字图像处理 使用C#进行图像处理九 实现傅里叶变换
- 03-04全面解析 Axios 请求库的基本使用方法
- 03-04Scala第六章节(类和对象的定义、访问修饰符和构造器的用法、main方法的实现形式、伴生对象的使用以及工具类的案例)
- 03-04Apache Paimon 的 Query Service 使用
- 03-04Linux使用git命令行教程-git 三板斧(add,commit,push)解释
- 03-04使用Python进行数据库连接与操作SQLite和MySQL【第—SQLite和MySQL】
- 03-04小巧玲珑的SQLite-SQLite的使用场景
- 03-04使用 Boot Camp 助理查明您的 Mac 需不需要 Windows 安装介质
- 03-04Python伪数据生成器Mimesis 使用
- 03-04【linux】使用less命令查找文件中的关键字