数据处理
暂时考虑用对训练数据的处理,减去对label的处理
- 注意将训练文本在word2id中不存在的值,修改成“unknow”(这一步需要在处理原数据的时候多设置一个unknow)
- re.split()里面传入多个符号不起作用的时候可以考虑,将每个符号用“|”分割开来
训练数据
- model = torch.load(path)
- model.eval() 这一步让模型变成预测状态
- 通过for循环喂入数据,进行预测(这里现在出现了bug,暂时考虑是在对每行数据进行处理的那里出现了问题)
待做
- 目前predic出来的是id,使用id2tag将其转换出来
- 将打出来的标签和原文档进行对应输出显示
- 做input输入的预测