酒店客人满意度的监督分类研究
1. 客人满意度差异与研究目标
客人在商务旅行时的总体满意度通常低于休闲旅行。不过,这一结果会受到一些背景因素的影响,例如旅行者的休闲与工作倾向、目的地的经济和文化特征以及旅行者的国籍等。
本研究旨在从Tripadvisor的酒店评论数据集中评估客人满意度。为了衡量满意度水平,我们使用了如朴素贝叶斯(NB)、决策树(DT)、随机森林(RF)、支持向量机(SVM)和人工神经网络(ANN)等分类器,并通过性能指标来检验它们的准确性。
2. 研究方法
2.1 数据描述与分析
我们进行了一项文本分析研究,旨在分析通过电子口碑(EWOM)体现的酒店客人满意度及其对TripAdvisor.com上酒店总体评分的影响。选择Tripadvisor.com的数据,是因为它是全球最大的电子服务社交媒体平台,拥有超过4.6亿条与酒店、餐厅和其他电子服务相关的EWOM。2015年共下载了569,861条评论,这些数据也可在https://twin-persona.org上免费获取。
该数据集包含来自酒店、餐厅和景点等不同服务类别的评论,我们选取了其中与酒店服务相关的239,859条评论。根据一个阈值,将这些客人进一步分为满意和不满意两类,其中满意客人有219,984人,不满意客人有19,875人。每条EWOM包含相关酒店的名称、评论正文、评论标题和总体评分。总体评分与评论数量的分布情况展示了不同评分下评论数量的相对频率。
以下是数据集中不同类别的评论数量:
| 类别 | 评论数量 |
| ---- | ---- |
| 满意客人 | 219,984 |
超级会员免费看
订阅专栏 解锁全文
34

被折叠的 条评论
为什么被折叠?



