特征工程

source: 浅谈微视推荐系统中的特征工程 - 知乎 (zhihu.com)

 

CTR的平滑处理

CTR除了是模型的预测值, 也可以作为其他模型的输入特征

贝叶斯平滑

对于某件商品或广告,其是否被点击是一个伯努利分布。伯努利分布的共轭分布就是 Beta 分布,也就是说,点击率服从 Beta 分布。而所有的数据有一个自身的点击率分布,这个分布可以用不同的 beta 分布来拟合。beta 分布可以看做是对点击率的一个先验知识,我们可以根据观测来修改我们的先验,所以贝叶斯平滑就是估计 Beta 分布中的参数 α 和 β,其中 C 和 I 是点击次数和曝光量。实际应用时根据历史数据得到的 α 和 β 可以帮助确定平滑参数的大致范围,防止设置参数时偏离过大。 特征工程

 

 

上一篇:CTR介绍,数据集往往为表格形式,训练集使用历史的日志数据,然后进行特征归一化、离散化和特征哈希等操作,最终一条训练集为一行多列的二分类任务。


下一篇:【报告分享】2021中国媒体市场趋势-CTR洞察(附下载)