文本描述
A Dissertation Submitted to Sichuan Agricultural University
in Partial Fulfillment of the Requirements for
the Degree of Master of Science
Research on Sentiment Analysis of Chinese
Text based on Deep Learning
by
Yuyang Zeng
Supervised by
Lecturer Ruirui Zhang
Majored in
Corporate Management
June, 2022
Sichuan Agricultural University / Business & Tourism School
Dujiangyan, Sichuan
论文独创性声明
本人郑重声明:所呈交的学位论文是我个人在导师指导下进行研究工作所取得的
成果。尽我所知,除了文中特别加以标注和致谢的地方外,学位论文中不包含其他个
人或集体已经发表或撰写过的研究成果,也不包含为获得四川农业大学或其它教育机
构的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已
在论文中作了明确的说明并表示了谢意。
研究生签名:
年
月
日
关于论文使用授权的声明
本人完全了解四川农业大学有关保留、使用学位论文的规定,即:学校有权保留
并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以
采用影印、缩印或扫描等复制手段保存、汇编学位论文。同意四川农业大学可以用不
同方式在不同媒体上发表、传播学位论文的全部或部分内容。
□本论文延迟
年后公开,到期后适用本授权。
(限制级及涉密学位论文请在□内划“√”,并填写延迟公开时限。不勾选此项,默
认为公开)
研究生签名:
年
年
月
月
日
日
导师签名:
摘 要
互联网用户作为网络信息的接收者和发送者,以发布在线评论的方式在网络平台上
产生大量带有主观性情感的文本数据,这些文本对于个人、商家和政府机关等都有着重
要的作用,通过对这些文本进行分析,可以做出相应的购买决策、运营策略以及舆情响
应措施。但是在互联网迅速普及和用户迅速增加的背景下,传统的统计学等方法已不足
以应对爆炸式增长的文本评论,深度学习以其优异的性能成为了研究者进行情感分析的
普遍方法,本文也利用该方法进行了中文文本情感分析的探索:
(1)根据以往研究中词嵌入方法低效及转化时间过长的现象,本文提出基于迁移学习
的卷积神经网络-双向长短时记忆网络混合模型,首先使用成熟高效的向量变换工具对
数据进行向量化表示,通过结合两个神经网络的优点,在商品在线评论数据集上实现二
元情感分析,精确率、召回率,F1值分别达到了 93.73%、93.39%和 93.56%,并构建多
个相关模型进行对比实验,取得最佳的结果,接着处理跨领域数据集,验证了其有效性
和泛化性。
(2)针对 Word2Vec不能根据语境动态表示词向量、双向长短时记忆网络参数较多、
卷积神经网络进行数据提取时导致信息丢失的问题,建立基于 Albert模型的双向门控循
环单元-多头自注意力机制-胶囊神经网络混合模型,对三分类情感数据进行处理。首先
使用 Albert模型生成词向量,结合双向门控循环单元与多头自注意力机制提取上下文信
息,再使用多粒度胶囊网络代替卷积神经网络对数据特征进行充分提取,并使用动态路
由机制对高层次特征进行提取融合,提高模型分类的效果。由于目前文本情感倾向的表
达逐渐多元化,于是本文对三元文本数据进行情感分类研究,在微博评论数据集上进行
实验,精确率达到了 91.76%,并构建了多个相关模型进行对比实验,验证了所提出模型
的效果和应用价值。
关键词:情感分析,Albert,迁移学习,胶囊网络,深度学习
I