文本描述
学位论文独创性声明
本人郑重声明:本人所呈交的学位论文,是在导师的指导下,独立进行研究所取
得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表
或撰写的作品,也不包含为获得安徽财经大学或其他教育机构的学位或证书所使用过
的材料。对本文的研究做出重要贡献的个人和集体,均已在文中标明并表示了谢意。
本声明的法律后果由本人承担。
论文作者(签名):
2022年 6月 25日
学位论文使用授权书
本论文作者完全了解学校关于保存、使用学位论文的管理办法及规定,即学校有
权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权安徽财经大学可以将本学位论文的全部或部分内容编入学校有关数据库和
授权学校研究生处与中国知网和万方数据签订收录协议及收录并由作者本人享有、承
担相应的权利和义务,也可以采用影印、缩印或扫描等复制手段保存或汇编本学位论
文。
注:保密学位论文,在解密后适用于本授权书。
作者签名:
2022年 6月 25日
基于集成学习的中小上市企业财务困境预警研究
摘要
中小企业是推动我国经济高质量发展和社会进步的中坚力量。据 2021年国务院
新闻办公室政策吹风会发布的数据显示:我国 4600万户企业市场主体中 99%以上为
中小企业,税收占比超过国家收入的 50%,并提供了 80%的就业岗位,在稳就业、
保民生、助发展等方面发挥着不可替代的关键作用。然而现阶段,我国中小企业在承
受着财务、会计体制不完善的内部挑战下仍面临新冠疫情、国际市场动荡等外部冲击,
遭遇财务困境而破产的中小企业数量逐年递增,2021年中小企业注销数量超 32万家,
有关中小企业财务困境的问题亟待解决。基于以上背景,本文构建财务困境预警模型
为中小企业及多方相关主体提供事前检测,进而避免中小企业陷入财务困境之中,这
对促进我国中小企业稳中向好持续发展具有重要意义。
本文将中小上市企业作为研究对象构建财务困境预警框架,包括指标体系构建、
特征工程、模型构建三部分,并将集成思想贯穿于特征选择模型构建、非平衡数据处
理、预警模型构建之中。首先,根据中小企业财务困境特点和参考以往文献的基础上
选择 7类财务指标,这些指标能够充分反映企业的偿债能力、盈利能力、经营能力、
每股指标、现金流动性、发展能力和相关披露财务指标补充信息,在此基础上增加代
表企业股本结构、股权集中度的 2类管理类指标初步构建指标体系。其次,在数据预
处理、统计分析、特征选择进行数据清洗和降维的基础上构建模型输入指标体系并进
一步对非平衡的中小企业数据进行平衡化处理保障后续预测模型取得较好的效果。最
后,基于模型集成框架以单一机器学习算法和集成学习算法为基础构建预警模型,通
过学习曲线调整优化模型参数实现最佳预测效果并与已有模型进行对比评价。结果显
示,本文所构建的中小企业财务困境预警框架效果理想。
本文采用财务数据披露程度较高的中小企业板块 928家企业 2018年(T-2期)至
2020年(T期)的数据作为原始数据,将“ST”或“*ST”企业作为存在财务困境的
样本共 65家,其他正常样本 863家。首先基于特征工程对数据预处理后的结果集成
6种机器学习算法(L1-Lg、SVM-RFE、f_classific、XGBoost、随机森林、极限树)
构建特征选择集成评分模型筛选出 32个重要性最高的指标形成实验指标体系;其次
将 RENN与 Borderline-SMOTE1相结合构建 RENN-Borderline-SMOTE1数据平衡算
法实现金融数据的平衡。最后引入 Blending模型集成算法,将决策树、Adaboost、X
-GBoost、LightGBM作为第一层基层模型,将逻辑回归作为第二层次学习器构建 Ble
-nding中小企业财务困境预测模型,通过学习曲线调整模型最优参数。模型评价指标
结果显示,本文构建的 Blending中小企业财务困境预测模型准确率达到 97.45%,召
回率达到 90.26%,f1-score为 0.97,AUC值为 0.975。经过与其他模型的对比试验中
1
摘要
发现在各类评价指标中 Blending中小企业财务困境预测模型表现最好,能够较好的
预测中小企业面临的财务困境风险,为中小企业财务困境预警模型集成方法的应用以
及模型参数优化与调整方面的研究做出有益探索。
关键词:中小上市企业;财务困境预测;模型集成;Blending集成算法
2
。。。以下略