业务背景
目前许多商家都有线上留言或者评论反馈平台,消费者可以在这些平台上通过留言表达自己对于消费商品的反馈。消费者的反馈包括表扬性的正向反馈,也有一些批评性质的负向反馈。商家需要掌握消费者对于产品的整体舆论取向来判断自己的产品质量是否符合消费者需求,同时了解评论内容可以方便商家分析舆论导向,指导下一步产品研发工作。
业务痛点
目前许多酒店、餐饮、零售的留言平台每天都有大量的留言产生,传统的舆论情绪收集方案是通过人工统计的方式,但是这种方式较为低效,很难针对大规模的舆论做出精确统计。需要自动化的手段收集并判断留言平台的舆论走向。
解决方案
PAI平台提供了一套基于文本向量化以及分类的算法,可以基于历史标记的正负留言内容生成分类模型,自动对平台上的新增留言进行预测。该服务的整体框架已经基于PAI-Studio开发完成,基于真实的打标后的11987条外卖平台评论数据,实现了自动化的正反面舆论风控,准确性达到75%左右。
1.人力要求:需要具备基础的NLP及分类算法知识用于模型调试
2.开发周期:1-2天
3.数据要求:最好有超过千条的打标数据,数据越多效果越好
数据说明
参数名称 | 参数描述 |
---|---|
label | 标签,1是正向评论,0为负面评论 |
review | 实际评论数据 |
流程说明
进入PAI-Studio产品:https://pai.data.aliyun.com/console
该方案数据和实验环境已经内置于首页模板:
打开实验:
1.数据源
上文提到的评论数据
2.停用词
过滤一些助动词以及标点符号,需要自己上传停用词表
3.文本向量化
利用Doc2vector算法把每个评论变成语意向量,每行是一个向量,每个向量代表一个评论的含义
4.生成分类模型
将向量化后的文本通过拆分算法拆分为训练集以及测试集,训练集通过逻辑回归算法训练生成二分类模型,该模型可以实现对于评论是正向评论或者负向评论的判断。
5.模型效果验证
通过混淆矩阵算法验证模型的实际效果,
总结
本文提到的基于留言评论的舆情风控方案可以用PAI组件在1-2天时间内非常快速的实现,实现后可以批量的对于平台上面的留言舆论进行智能化分析,并且随着数据的累计,模型的准确性会逐渐增强。该方案适用用各种基于文本场景的分析,比如垃圾邮件分类、新闻正反情绪分类等。