CTR介绍,数据集往往为表格形式,训练集使用历史的日志数据,然后进行特征归一化、离散化和特征哈希等操作,最终一条训练集为一行多列的二分类任务。

在CTR预估任务中数据集往往为表格形式,训练集使用历史的日志数据,然后进行特征归一化、离散化和特征哈希等操作,最终一条训练集为一行多列的二分类任务。

在CTR训练过程损失函数可以使用交叉熵:

CTR介绍,数据集往往为表格形式,训练集使用历史的日志数据,然后进行特征归一化、离散化和特征哈希等操作,最终一条训练集为一行多列的二分类任务。

CTR模型的发展可以分为特征工程和模型两个部分,在早期CTR模型主要依赖人工特征工程,然后随着深度学习的发展逐步依赖复杂的网络模型设计。 

CTR介绍,数据集往往为表格形式,训练集使用历史的日志数据,然后进行特征归一化、离散化和特征哈希等操作,最终一条训练集为一行多列的二分类任务。

 

LR

在早期逻辑回归LR是最基础的CTR模型,模型简单且训练速度很快,m为特征个数。

CTR介绍,数据集往往为表格形式,训练集使用历史的日志数据,然后进行特征归一化、离散化和特征哈希等操作,最终一条训练集为一行多列的二分类任务。

 

FM

Factorization machine (FM)给每个特征分配个隐含的向量,可以自动的完成特征交叉:

CTR介绍,数据集往往为表格形式,训练集使用历史的日志数据,然后进行特征归一化、离散化和特征哈希等操作,最终一条训练集为一行多列的二分类任务。

其中特征i与特征j的相关性通过CTR介绍,数据集往往为表格形式,训练集使用历史的日志数据,然后进行特征归一化、离散化和特征哈希等操作,最终一条训练集为一行多列的二分类任务。来完成自动学习。 

 

上一篇:typora 基本使用和漂亮的主题样式


下一篇:特征工程