文本描述
吉林大学硕士学位论文原创性声明
本人郑重声明:所呈交学位论文,是本人在指导教师的
指导下,独立进行研究工作所取得的成果。除文中已经注明
引用的内容外,本论文不包含任何其他个人或集体已经发表
或撰写过的作品成果。对本文的研究做出重要贡献的个人和
集体,均已在文中以明确方式标明。本人完全意识到本声明
的法律结果由本人承担。
学位论文作者签名:
日期:2022 年12月3 日
III
关于学位论文使用授权的声明
本人完全了解吉林大学有关保留、使用学位论文的规定,同意吉林大
学保留或向国家有关部门或机构送交论文的复印件和电子版,允许论文被
查阅和借阅;本人授权吉林大学可以将本学位论文的全部或部分内容编入
有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文和汇
编本学位论文。
(保密论文在解密后应遵守此规定)
论文级别:■硕士□博士
学科专业:金融
论文题目:基于文本挖掘的投资者情绪指标构建及其在量化投资策略
中的应用
作者签名:
指导教师签名:
2022年12月3日
作者联系地址(邮编):
作者联系电话:
IV
摘要
随着互联网地快速发展和社交媒体的兴起,股吧做为重要的信息交流平台,不但
可以为投资者提供许多有价值的信息,还可以成为投资者表达观点和情绪的数字化平
台。当资本市场出现突发性事件时,股吧评论区会涌现大量投资者的评论,这些评论
大多都带有强烈的主观情绪,而这些情绪的凝聚会直接影响投资者的策略和股票的价
格。自 2018年以来,国际政治经济形势面临的不确定性增加,贸易摩擦、新冠疫情
以及俄乌战争等突发性事件频发,股吧评论更是成为了市场舆情的热点。因此,关注
股吧的投资者情绪对于构建投资策略以及舆情监管是非常重要的。
本文以事件驱动行情为研究对象,通过改进情感词典,构建投资者情绪指标,对
比分析了词典改进前后的投资策略。基于 2019年中美贸易战中稀土出口事件,首先,
本文选择与该事件相关的 10支股票作为研究对象,通过 Python在东方财富股吧中爬
取每支股票评论贴作为情绪文本,在台大情感词典的基础上对情绪词典进行改进,构
建了新的情绪指标。其次,通过使用“情绪因子 +看涨指标”的均线策略,对比了词
典改进前后的投资策略收益。结果显示:( 1)使用改进后的词典构建的情绪因子在
策略的应用中获得了更高的收益;(2)在有无情绪指标的情况下对比策略显示:加
入情绪因子使得夏普比率和收益率显著提高;( 3)为了验证本算法的稳健性,我们
通过替换样本事件进行检验,结果证明:改进后的词典构建的情绪因子能够取得更好
的策略效果。
本文的创新之处:第一,在词典创新方面,本文改进后的情感词典具有更出色的
回测效果。通过参考股吧评论贴、研报和新闻等词汇对台大词典进行改进,然后对情
绪文本采用累计得分的形式计算出情感得分,在研究方法上较以往的研究得到进一步
扩展;第二,在策略研究方面,本文引入了情绪指标作为策略观测对象,构建了“情
绪因子+看涨指标”的均线策略。通过不同词典以及有无情绪指标前后的策略进行对
比分析,使得研究角度更加全面,研究内容也更加丰富
关键词:文本挖掘情绪指标量化投资事件驱动
V