1、增量训练
复用模型,用最新的数据做强化训练()
2、全量训练
不复用模型,用所有的数据从头开始训练
3、线上线下不一致
线上模型(请求router的item打分)线下模型,离线模型 对同一个视频的预测值应该是一样的 因为用的是相同的模型
https://blog.csdn.net/weixin_42134034/article/details/105740783
相同模型,不同数据集的不一致
模型的不同导致的不一致 (线上模型解析出错导致) 目前接触的一致性验证
4、模型训练的特征抽取
user_id [1,0,0,0.............] ->[slot_id][hash_name] user - item ->score