==>> 点击下载文档 |
机器学习的方法可以分为以下几类:监督学习、无监督学习、深度学习及其他
机器学习方法(例如强化学习),对应到具体的模型上数量则更是繁多,目前大
部分机器学习模型并未广泛的应用在投研领域,因此本系列主要偏重于在投研
领域有应用潜力的模型及方法。此篇将以介绍监督学习方法为主
监督学习模型之回归类模型及其应用
与普通线性回归不同,监督学习中的惩罚回归模型和非参数回归,可以分别用
于处理输入变量中存在大量线性相关性关系及非线性关系时的情况。惩罚回归
模型中金融领域使用得较多的有Lasso回归、岭回归和弹性网络回归;具有代
表性的非参数回归模型则有:K最近邻、LOESS及卡尔曼滤波器。同时,也用
到两个实例来说明了惩罚回归模型在拟合中的优势,以及卡尔曼滤波器使用时
对于趋势判断、状态分辨的灵敏性
监督学习模型之分类模型及其应用
回归模型可以通过模型拟合进行样本外数据预测,得到具体的预测值。但是在
金融领域很多问题不需要得到具体的值,得到目前的状态类型或者相对强弱位
置即可。因此,分类模型应用非常广泛。此篇,我们将介绍以下分类算法:逻
辑回归、支持向量机(SVM)、决策树、随机森林以及隐马尔可夫模型。前面四
种模型我们将会给出具体的择时和选股上的实例,隐马尔科夫模型我们则是验
证其对于国内A股市场的状态划分是否有效
监督学习模型的总结和比较
我们介绍的几种模型的共同特点是模型中都会要求有一个训练期(样本内)和
预测期(样本外),通过训练期来找到最优参数,拟合非线性关系,然后在预测
期内进行应用。不同模型的主要应用情景不同,具体可以参考我们给出的不同
模型的实例。后面将会陆续介绍非监督学习和深度学习的方法及具体应用情景,
并从模型中延展开来,持续追踪人工智能和大数据领域的发展状况及应用实践
[Table_Author] 分析师 覃川桃
(8621)68751782
qinct@cjsc
执业证书编号:S0490513030001
联系人 陈洁敏
(8621) 68751787
chenjm5@cjsc
联系人 杨靖凤
(8621)68751636
yangjf@cjsc
分析师
[Table_Doc] 相关研究
《陆港通系列(一):外资动向中的Alpha》
2017-7-24
《富时中国A50指数投资价值分析》2017-6-8
《基金的绩效归因方法分析及应用》2017-6-6
风险提示: 1. 模型在使用中存在建模风险;
2. 本文举例均是基于历史数据不保证其未来收益
请阅读最后评级说明和重要声明 2 / 23
金融工程丨专题报告
目录
机器学习方法概述4
传统机器学习在金融上的应用 ......... 4
深度学习的应用 ....... 5
机器学习模型的应用情景 .... 5
监督学习模型之回归 ......... 6
惩罚回归模型 .......... 6
Lasso回归、岭回归和弹性网络回归 ....... 6
惩罚回归模型应用实例 .... 7
非参数回归 .. 9
K最近邻和LOESS ......... 9
动态系统-卡尔曼滤波 ...... 9
卡尔曼滤波应用实例 ...... 10
极限梯度提升(XGBoost) .......... 13
监督学习之分类 .. 13
逻辑回归 ... 14
支持向量机14
决策树和随机森林 . 14
分类模型在选股及择时上的应用实例 ........ 15
SVM模型应用于沪深300内选股 .......... 15
随机森林依据多因子数据的择时17
隐马尔科夫模型 ..... 19
隐马尔科夫模型的应用实例 ....... 19
总结 ........ 22
图表目录
图1:机器学习/人工智能方法介绍 ....... 4
图2:欠拟合、过拟合及完美拟合图例 . 6
图2:惩罚回归模型的拟合效果比较 ..... 8
图3:Lasso模型中beta选择的轨迹图8
图4:中国银行和交通银行价格(取自然对数)走势图 .......... 11
图5:中国银行和交通银行价格(取自然对数)走势图 .......... 11
图6:卡尔曼滤波器和OLS回归估计的beta值 ......... 12