基于LDA的游客网络评论主题分类:以故宫为例
基于LDA的主题发现模型;
【关注问题】
主题及情感倾向;
关键词 LDA 游客 网络评论 情感分析 故宫
【主要模块】
1.LDA主题分类,得到4个主题为最优结果;
2.建立旅游情感词典,分析情感极性。
【其他技术点】
1.LDA文本自动分类模型,能够通过隐含主题将不同文本联系起来;
2.采用Gibbs采样来估计LDA模型相应参数;
3.数据预处理:
分词和词性标注采用中科院计算所ICTCLAS分词词性标注一体化系统;
去停用词采用停用词表;
语义去重利用Hownet。