==>> 点击下载文档 |
摘要:
[Table_Summary]深度学习在语音、视频、自然语言处理等领域的成功使得越
来越多的投资者开始尝试将其运用到投资中,然而,更高的
噪音、更复杂的影响因素使得很多经典算法并不适用。本篇
报告借鉴国外的“深度组合”理念,尝试将深度学习的基本
理念使用到选股研究中
度组合并不是方法论的创新,而是对市场不同角度的解读
之后我们对深度组合的构建方法做了详细介绍,并通过在沪
深300上的选股实证为例,进一步介绍了数据处理的细节
络学习原始数据特征,转化为分类问题对T+1时期进行预测,
通过指标验证组合构建的合理性并确定持仓方案
编码过程中的损失函数作为指标,对策略进行了优化。一方
面,对选股池中的股票,只选取置信度高的个股进行处理;
另一方面,通过该指标判断策略是否失效。我们通过实证分
析中的指标检验证明了该指标确实和策略收益是高相关的,
并且不存在滞后性,从而使得策略在出现回撤时有章可循
该策略从2010年中至2017年中的七年时间里,在8.33%的
最大回撤下获得约18.37%的年化收益,领先于传统的动量策
略,并且,策略在今年取得了7.113%的超额收益
从收益端和风险端对原策略均有提升,进一步证实了指标的
可靠性
金融工程团队:
刘富兵:(分析师)
电话:021-38676673
邮箱:liufubing008481@gtjas
证书编号:S0880511010017
陈奥林:(分析师)
电话:021-38674835
邮箱:chenaolin@gtjas
证书编号:S0880516100001
李辰:(分析师)
电话:021-38677309
邮箱:lichen@gtjas
证书编号:S0880516050003
孟繁雪:(分析师)
电话:021-38675860
邮箱:mengfanxue@gtjas
证书编号:S0880517040005
蔡旻昊:(研究助理)
电话:021-38674743
邮箱:caiminhao@gtjas
证书编号:S0880117030051
殷明:(研究助理)
电话:021-38674637
邮箱:yinming@gtjas
证书编号:S0880116070042
叶尔乐:(研究助理)
电话:021-38032032
邮箱:yeerle@gtjas
证书编号:S0880116080361
[Table_Report] 相关报告
《板块及行业指数价格分段研究》2017.07.05
《基于信息冲击视角的盈余公告效应研究》
2017.07.04
《回撤控制下的最优化大类资产配置策略》
2017.07.03
《基于短周期价量特征的多因子选股体系》
2017.06.15
《基于短周期价量特征的多因子选股体系》
2017.06.01
数
量
化
专
题
报
告
金融工程
金
融
工
程
证
券
研
究
报
告
数量化专题报告
请务必阅读正文之后的免责条款部分 2 of 21
目录
1. 引言 ....... 3
2. 深度组合理念.. 4
2.1. 深度组合的基本概念 ..... 4
2.2. 深度组合的构造 .. 5
2.3. 隐含假设 .... 5
3. 深度组合的理论基础及其不同视角 ......... 6
3.1. Markowitz和Black-Litterman的视角6
3.2. 信息论的视角 ...... 7
3.3. 传统多因子模型的视角7
4. 基于深度组合的选股策略 ... 8
4.1. 自编码学习隐含特征 ..... 8
4.2. 转化为经典分类问题 ... 10
4.3. 模型选择及验证10
4.4. 构造深度组合的一般方法 ..... 11
5. 沪深300选股实证分析 ...... 11
5.1. 数据准备和预处理 ....... 11
5.2. 选股策略构建 .... 13
5.3. 归因分析 .. 16
5.4. 策略指标分析 .... 17
5.5. 利用损失函数优化策略 .......... 18
6. 总结与展望 .... 19
6.1. 深度组合选股方法的优势和不足 .... 19
6.2. 深度组合方法的未来应用 ..... 20
数量化专题报告
请务必阅读正文之后的免责条款部分 3 of 21
1. 引言
量化选股研究一直是量化领域经久不衰的课题,其本质是在某个特定的
股票池内,通过寻找某些个股优于一般股票的“性质”,以这些性质为
基础构造组合,从而得到长期跑赢基准的策略。这里的“性质”传统意
义上被称为“因子”,并由此衍生出一系列研究,包括如何挖掘具有稳
定超额收益的因子,如何通过因子构造最优组合,如何平衡收益、风险、
成本等投资因素,等等。然而,随着传统风险管理模型的兴起,投资者
会发现挖掘新的具有“边际收益”的因子越来越难,同时,已知因子的
收益也随着市场风格变换越来越不稳定,有些甚至渐渐失效。因此,在
这个时点,我们有必要放开思路,重新审视因子选股
与此同时,深度学习在包括视觉图像、音频信号处理、自然语言处理甚
至自动驾驶等诸多传统领域都获得了巨大的成功,“人工智能”一词已
经代替过去泛滥的“大数据”一词,一跃成为投资者们新的宠儿,甚至
有人开始怀疑不久后会出现“投资机器人”,取代基金经理的工作。然
而,当国内外诸多学者将深度学习算法应用到投资领域后发现,远高于
传统领域的噪音和变量都使得深度学习在投资领域的研究并不那么容
易成功。但是,这并不是宣告了深度学习的死刑,相反,近年来越来越
多的研究者开始涉足该领域,在美国,越来越多的对冲基金开始引入人
工智能的研究,甚至在国内,也开始有一批通过深度学习算法获得稳定
超额收益的尝试涌现出来
深度组合和传统的多因子体系不同,它使用深度神经网络训练出的因子
进行组合构造,其最大的不同点就是无论是因子本身还是组合的构建过
程都是非线性的。由于非线性的复杂性,因此这种构造过程需要更多的
参数,更多的数据量支撑。深度学习使得这一切成为可能。本篇报告即
是根据国内外众多的已有研究,综合其理念,并加入了一些自己的思考,
针对因子选股问题进行了一些新的尝试。我们发现,通过这种方式构建
的组合,由于非线性特征的复杂性,其稳定性虽然不能和传统的多因子
选股方法相比,但在一些传统选股方式受挫的年份能够较高的超额收
益,从而对因子选股研究做了有益的补充。具体到实证方面,我们在沪
深300内的选股策略可以在2011年至今在8.33%的回撤下跑出18.37%
的年化超额收益,其中,今年以来超额收益达到7.11%,最大回撤1.33%
本篇报告的结构如下:第二章首先介绍了深度组合的基本概念以及其构
造方法;第三章则从不同的视角对深度组合的概念进行了诠释,这些是
深度组合的理论基础,通过对这些视角的观察,一方面我们能更好的理
解深度组合,另一方面我们也发现,其实这种构建方式并不是方法论上
的创新,其基本思想和传统金融理论完全兼容;第四章开始介绍构建深
度组合的细节算法,包括自编码学习隐含特征以及将选股问题转化为分
类问题来处理,并给出了学习算法的一般方法;第五章我们对沪深300
选股做了实证分析,并对结果进行了分析和优化;最后,我们总结了深
度组合方法的优势与不足,并对未来研究方向进行了展望
数量化专题报告
请务必阅读正文之后的免责条款部分 4 of 21
2. 深度组合理念
本章主要介绍深度组合的基本概念,并对如何通过深度神经网络构建深
度组合做一个大致的轮廓式的介绍,从而给读者一个初步印象。第四章
中我们会对本章提到的算法进行详细介绍
2.1. 深度组合的基本概念
深度组合这个理念首次提出是由JB Heaton在其2016年9月的论文
《Deep Learning in Finance: Deep Portfolios》中提出。文中提出了深度组
合这个概念,但是却并没有对如何构建组合进行详细描述。这里的“组
合”和组合管理中的“组合”含义并不相同,其构建目的是为了预测标
普500指数的下一期收益率。但是,通过深度神经网络提取因子的思想
却被和很多其他研究不谋而合。其中,Lawrence Takeuchi在其论文
《Applying Deep Learning to Enhance Momentum Trading Strategies in
Stocks》就详细描述了如何通过深度组合对传统的动量效应进行增强
同样,在音频处理领域大热的LSTM的算法也被运用到股票时间序列预
测中,Jakob Aungiers在其论文《LSTM Neural Network for Time Series
Prediction》中详细描述了他所在的对冲基金是如何运用该算法进行投资
的
然而,本篇报告并不旨在对深度学习本身进行科普性介绍,也不对其算
法及其推导过程进行详细描述。相反,我们希望借鉴海内外已有研究,
结合自己的思考,将深度学习算法中的核心理念运用到选股中,并解决
投资中的实际问题,例如投资者谈“机器学习”而色变的“黑箱问题”,
回测效果好而实际效果差的过拟合问题等
为了让大家对深度组合有一个大致的了解,这里先简单介绍深度神经网
络的概貌,至于和神经网络相关的细节问题,例如前向后向算法、神经
单元的优化等问题我们不做介绍,具体实施细节属于计算机算法范畴,
可以参考神经网络相关书籍文献
图1深度神经网络示意
数据来源:国泰君安证券研究
。。。以上简介无排版格式,详细内容请下载查看