目录
代码来源:https://github.com/zzy99/epidemic-sentence-pair
目标:学习Keras来解决句子相似度问题
关键词:keras,bert4keras,句子相似度,多折交叉,模型融合
我的视频讲解:
一、核心环境及代码修改
作者代码环境:tensorflow 1.14,bert4keras 0.4.3
但是现在(2021.2.6,周六)只能安装当前最新bert4keras 0.9.9版本,所以需要进行部分代码修改:
trai.py文件中:
# from bert4keras.bert import build_bert_model # 8行
from bert4keras.models import build_transformer_model
# from bert4keras.tokenizer import Tokenizer # 9行
from bert4keras.tokenizers import Tokenizer
# bert = build_bert_model(..) # 41行
bert = build_transformer_model(..)
# token_ids, segment_ids = tokenizer.encode(text1, text2, max_length=64) # 102行
token_ids, segment_ids = tokenizer.encode(text1, text2, maxlen=64)
predict.py文件中采用相同修改。
另外,还需要对一些文件路径进行适当修改。
二、详细介绍
见视频讲解部分。