MCM思路

思路

要求1:

  1. 进行数据筛选清洗 over
  2. 找到星级、评论(直接用长度?文本情感分析进行分级?)、有用性程度(即投票比值)这三者之间的关系,俩俩互相关系有三种,然后就是三者总的关系(按蒲俊的说法星级为函数,评论与投票比值为自变量找函数关系)

在相关性分析中,除了运用spss计算出结果表格,还可贴上对应的散点图说明。

参考https://minimaxir.com/2014/06/reviewing-reviews/

要求2:

a问题:

相当于找到一个评级模型对产品进行综合评价打分(根据现有的用户评分和评论),让阳光公司能及时追踪自己的三种产品在市场上的反响。

难点是情感分析量化评论!

这部分可以贴一些词频统计生成的词云。

可采用简单的综合评价方法(例如线性加权)得到综合评价结果。

b问题:

基于时间:就有两种考虑:根据年份和根据月份做

例如:x轴为2004年——2015年 与 x轴为1月——12月

声誉是什么? 应该就是a问题中求出来的综合评价分数。

最终拟合综合评价分数和时间的关系????

贴拟合曲线图

c问题:

找最成功和最失败的产品

根据b问题中声誉时间函数中找峰值和拐点左右的数据进行分析就是潜在最成功和最失败的产品。

d问题:

找出具体的product_id中评论数较多的几个商品,然后确定一个特殊星级的时间节点,看他之后一个月内或一年内的评论多少与这个时间节点之前同样时间段评论的条数的比例,如果小于1的占多数,说明特殊星级并不会引起更多评论。

e问题:

类似于上一题找出具体的几件商品,确定一个评论中含有积极或消极含义词语的时间节点,找出在他之前的评论平均评分是多少,之后的平均评分是多少,如果之后的分数有明显所上升或下降则说明这些积极或消极类的评论描述与评分水平密切相关。

要求3:

写一篇1-2页的信给阳光公司市场总监,总结我们这次的分析内容和结果,讲述一下这三个市场的特点,何时进入这三个市场最好,自家产品设计需要注意哪些功能,在线销售的战略有哪些(①引导评论②哪个时间促销打折)

上一篇:@[TOC](HDUOJ 2031进制转换)


下一篇:前端开发:一个开源、简单易用的jQuery表格插件(DataTables)