文本描述
基于文本分析和图片识别的在线评论 有用性研究:以Yelp平台为例 工商管理 2023届 周小力 罗莉娟 上海外国语大学 硕士学位论文 基于文本分析和图片识别的在线评论有用 性研究:以Yelp平台为例 院系:国际工商管理学院 学科专业:工商管理专业 姓名:周小力 指导教师:罗莉娟 2023年 6月 Shanghai International Studies University ENGLISH TITLE Research on the online review helpfulness based on text analysis and image recognition: Evidence from Yelp By Zhou Xiaoli Under the Supervision of Professor Luo Lijuan June 2023 答辩委员会成员 主席:吴联仁 成员:马宝军尚珊珊 摘要 摘要 对于潜在的消费者来说,在线评论可以帮助他们评估一家餐厅的质量,并 为未来的选择提供重要信息。然而,随着在线评论数量的增加,消费者处理评 论中的信息需要的大量时间和精力,确定评论的有用性程度变得非常重要。评 论的有用性的影响因素,例如评级、评论的数量、评论的可读性、评论的持续 时间和评论中的情感等已经被学者研究。但是,使用相对较新的信息熵方法探 索评论文本的内容特征如何影响其有用性仍然是值得探讨。特别是,随着越来 越多的人对拍摄图片感兴趣,用图片发表评论也变得越来越流行,图片带来的 内容信息对在线评论有用性的影响依然可以作实证分析。本研究借鉴了信息质 量理论和双重加工理论,研究评论文本和评论图片的信息内容如何在更精细的 维度上影响评论的有用性。尽管在线评论中的文字和图片信息的结合已经被验 证对预测在线评论的有用性有显著的影响,但评论的文字内容和图片中的哪些 信息对预测在线评论的可用性有显著影响仍然值得研究。因此,研究依据评论 特征从评论文本和评论图片角度切入研究其对在线评论有用性的影响,研究内 容可以分为以下两个部分: 第一,基于文本分析的评论有用性影响因素研究。为了识别用户评论文本 内容中所包含的具体信息,以构建影响在线评论有用性模型中的信息熵,研究 使用了来自 Yelp网站的 59,358篇评论。以信息质量理论为基础,引入信息 熵的概念,使用 Python软件对评论中的文本内容进行词频提取,获取与餐厅相 关的食物类词、服务类词、环境类词,进而根据熵理论计算评论文本的食物熵、 服务熵、环境熵,研究消费者感知的食物、服务、环境信息对评论有用性的影 响。除此之外,本文基于双重加工理论分析系统性线索和启发式线索的带来的 调节作用,通过使用 LIWC情感分析工具 (Linguistic Inquiry and Word Count)分 析得出评论文本的情感极性,并引入视觉线索作为调节变量构建了评论文本对 在线评论有用性影响因素分析的研究模型。研究得出食物熵、环境熵、服务熵 显著正向作用评论有用性,视觉线索在食物熵、服务熵作用评论有用性过程中 起到积极作用,在环境熵作用评论有用性过程中具有相反的效果。积极情感在 环境熵、服务熵作用评论有用性过程中起到消极作用,消极情感在食物熵作用 评论有用性过程中起到抑制作用。 第二,基于图片识别的评论有用性的影响因素研究。为了研究评论图片信 息丰富度对在线评论有用性的影响,使用网络爬虫工具抓取了来自 Yelp网 站的评论,经过筛选后 5,618条带有图片的评论被使用。研究以信息质量理论为 基础,从与餐厅相关的食物、环境、人员、菜单维度出发,通过人工识别评论 II