Git Product home page Git Product logo

reference-project / customer_satisfaction_analysis Goto Github PK

View Code? Open in Web Editor NEW

This project forked from carrychang/customer_satisfaction_analysis

0.0 2.0 0.0 929 KB

2018年1月参与重庆市在线民宿满意度测评项目,负责数据采集、主题抽取、情感分析等任务。开发的目的是克服用户打分和评论不一致,实时对重庆地区在线民宿的满意度进行评测,使用Python实现了在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询POI信息的功能;构建了基于在线民宿语料的Word2vec主题聚类模型,利用主题中心词能找出对应的主题属性字典;以用户打分作为标注,然后通过实验贝叶斯、SVM、决策树等多种分类模型,最后选用贝叶斯模型进行情感分析,将情感分类概率分布作为情感趋势,最后通过POI热力图的方式对不同地域的民宿满意度进行展示。

License: Apache License 2.0

Python 100.00%

customer_satisfaction_analysis's Introduction

Customer_satisfaction_Analysis(重庆在线民宿满意度测评)

2018年1月参与重庆市在线民宿满意度测评项目,负责数据采集、主题抽取、情感分析等任务。开发的目的是克服用户打分和评论不一致,实时对重庆地区在线民宿的满意度进行评测,使用Python实现了在线评论采集和情感可视化分析。搭建了百度地图POI查询入口,可以进行自动化的批量查询POI信息的功能;构建了基于在线民宿语料的Word2vec主题聚类模型,利用主题中心词能找出对应的主题属性字典;以用户打分作为标注,然后通过实验贝叶斯、SVM、决策树等多种分类模型,最后选用贝叶斯模型进行情感分析,将情感分类概率分布作为情感趋势,最后通过POI热力图的方式对不同地域的民宿满意度进行展示。分析流程利用机器学习有监督标记样本进行分类,解决了因情感字典覆盖率不全造成分类精度低的问题。用户打分和评论不一致在满意度测评中影响比较大,使用自然语言处理技术能挖掘用户情感和需求,具体的打分和评论不一致现象如下。
主要功能包括在线原始评论采集、主题分类、评论情感分析与结果可视化展示等四个模块,如下所示。
  1. 使用Selenium模拟浏览器点击翻页操作,并配合Request实现了携程网爬虫封锁和自动化的采集民宿UGC内容的功能,提取后的民宿地址和在线评论等信息如下。
  1. 搭建了百度地图POI查询入口,可以进行自动化的批量查询POI信息的功能,信息直接存入excel中
  1. 通过高频词可视化展示,归纳出评论主题
  1. 构建了基于在线民宿语料的Word2vec主题聚类模型,利用主题中心词能找出对应的主题属性字典,并使用用户打分作为标注,然后通过实验贝叶斯、SVM、决策树等多种分类模型,选用最优模型对提出的评价主体 进行情感分析,针对主题属性表进行主题提取后的文本进行情感分析,分别得出当前主题对应的情感趋势,横坐标为所有关于主题为“环境”的情感得分,纵坐标为对应的情感的条数,可以起到纵观当前“环境”主题下的情感趋势,趋势往右代表当前主题评价较好,总共有{“交通”,“价格”,“体验”,“服务”,“特色”,“环境”,“设施”,“餐饮”}的主题,选取“环境”主题进行可视化之后的结
  1. 通过POI热力图的方式对在线民宿满意度进行展示。
  1. 代码结构如下

customer_satisfaction_analysis's People

Contributors

carrychang avatar

Watchers

James Cloos avatar Lizhao Du avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.