推荐系统中为什么要有召回、粗排、精排

2023-10-18 10:30:58

为什么要把排序分为精排和粗排？

把排序阶段分为粗排和精排，其实就是生成环境中成本和结果的一个平衡。进入排序阶段的候选集一般确实只有几千个，但是对于抖音、YouTube这种量级的应用来说，他们request是非常多的，依然不能上太复杂的模型和特征。

因此把排序分为粗排和精排：

粗排漏斗一般是：几千 -> 几百

精排漏斗一般是：几百 -> 几个

这样精排可以把模型和特征做到极致，可以达到非常高的精度

召回是漏斗的最上游，可以说是决定了推荐系统的上限

召回的目标是召回用户可能感兴趣的 item，会考虑多方面的因素

粗排是对召回的结果进行排序，top k 送入精排，常用的有两种建模方式：

1. 独立建模，如在在广告推荐中，粗排也是优化ecpm，在推荐中也是优化Finish、Staytime等

2. 对齐精排，用 leaning to rank 等方法去学习精排的序