bilstm-crf模型使用(摸索版)

数据处理

暂时考虑用对训练数据的处理,减去对label的处理

  • 注意将训练文本在word2id中不存在的值,修改成“unknow”(这一步需要在处理原数据的时候多设置一个unknow)
  • re.split()里面传入多个符号不起作用的时候可以考虑,将每个符号用“|”分割开来

训练数据

  • model = torch.load(path)
  • model.eval() 这一步让模型变成预测状态
  • 通过for循环喂入数据,进行预测(这里现在出现了bug,暂时考虑是在对每行数据进行处理的那里出现了问题)

待做

  • 目前predic出来的是id,使用id2tag将其转换出来
  • 将打出来的标签和原文档进行对应输出显示
  • 做input输入的预测
上一篇:CRF++工具包的使用


下一篇:【机器学习笔记十一】 条件随机场(CRF)