业务背景
在业务发展过程中有两个重要的环节,一个是拉新,另一个是留存。如何做到用户的留存需要很多技术手段保证,一个比较重要的方式是建立用户流失模型,通过学习历史上流失用户的特点,通过机器学习的手段训练处风控模型,队可能会流式的用户进行预测,然后可以提前通过运营手段做一些用户流失的防范。
业务痛点
目前用户流失预警监控是业内主流的需求之一,但是缺少智能化的预测手段和机制。目前主流的一些预警方案都是基于一些规则的方案,对于一些潜在可能流失的用户没有很准确的发掘手段。
解决方案
PAI平台提供了一套基于打标数据的特征编码、分类模型训练、模型评估的方案。
1.人力要求:需要具备基础的建模背景知识
2.开发周期:1-2天
3.数据要求:最好有超过千条的打标数据,打标哪些客户在哪种特征情况下流失过,数据越多效果越好
数据说明
数据来自真实的电信领域客户行为数据,包含用户的基本属性以及用户是否会流失,数据一共7043个用户样本。
特征数据:
参数名称 | 参数描述 |
---|---|
customerid | 用户ID |
gender | 性别 |
SeniorCitizen | 是否是个市民,1是,0不是 |
Partner | 是否有Partner |
Dependents | 是否有从属关系 |
tenure | 客户在这个公司使用的时长 |
PhoneService | 是否有手机服务 |
MultipleLine | 是否有多条线路 |
InternetService | 互联网服务商DSL、Fiber optic、No |
OnlineSecurity | 是否有互联网在线安全问题 |
OnlineBackup | 是否有线上支持 |
DeviceProtection | 是否有服务保护 |
TechSupport | 是否申请过技术支持 |
StreamingTV | 是否有流TV |
StreamingMovies | 是否有流电影 |
Contract | 合同时限,Month-to-month、Two year |
PaperlessBilling | 是否有电子账单 |
PaymentMethod | 付款方式 |
MonthlyCharges | 月消费 |
TotalCharges | 总消费 |
目标数据:
参数名称 | 参数描述 |
---|---|
churn | 用户是否流式 |
流程说明
进入PAI-Studio产品:https://pai.data.aliyun.com/console
该方案数据和实验环境已经内置于首页模板:
打开实验:
1.数据源
上文提到的用户流式用户的数据
2.特征编码
通过One-hot以及SQL组件实现特征工程建模,将原始的字符型特征转为数值型特征。
以目标字段churn为例,原始数据是“Yes”和“No”,可以通过SQL语句把"Yes"变为1,“No”变为0:
select (case churn when 'Yes' then 1 else 0 end) as churn from ${t1};
3.模型训练
将数据分成两部分,一部分作为训练集训练模型,另一部分做预测集验证模型效果。用户流失预警是个二分类问题,一个用户只有流失和不流失两种可能性。所以选用二分类算法来处理,生成的分类模型可以一键部署为RestfulAPI服务供业务方调用。
4.模型效果验证
通过二分类评估组件验证模型准确性,准确性描述指标AUC可以达到0.83,也就是说预测的准确性在80%左右。
总结
用户流失预警是所有B端客户都可能应用到的场景,PAI提供了一套完整的基于用户特征的算法,可以帮助客户在1-2天快速实现用户流失模型的训练,大大提速了整个实验搭建的周期。>