==>> 点击下载文档 |
支持向量机模型的构建:样本内训练与交叉验证、样本外测试
支持向量机模型的构建包括特征和标签提取、特征预处理、样本内训练、
交叉验证和样本外测试等步骤。最终在每个月底可以产生对全部个股下期
上涨概率的预测值,然后根据正确率、AUC等指标以及策略回测结果对模
型进行评价。我们还根据模型的预测结果构建了沪深300成份内选股、中
证500成份内选股和全A选股策略,通过年化收益率、信息比率、最大回
撤等指标综合评价策略效果
高斯核支持向量机选股模型收益和信息比率的表现优于线性回归
对于沪深300成份股内选股的行业中性策略(每个行业选6只个股),高
斯核SVM模型的超额收益为4.9%,信息比率为1.22。对于中证500成份
股内选股的行业中性策略,高斯核SVM模型的超额收益为9.0%,信息比
率为2.37。对于全A选股的行业中性策略,高斯核SVM模型相对于中证
500的超额收益为21.1%,信息比率为3.66。总体而言,高斯核SVM在
收益和信息比率方面表现不错,各种策略构建方式下都能稳定地优于线性
回归模型;最大回撤方面SVM模型相比于线性回归不具备明显优势
高斯核支持向量机模型预测能力整体强于其它核支持向量机
我们比较了不同核支持向量机的预测能力,发现高斯核SVM的测试集正确
率、AUC和回测表现普遍优于其它核函数。高斯核作为使用最为广泛的核
函数,其优势在于不对原始数据做太多的先验假设。我们的回测结果也印
证了这一点,通过交叉验证集调参,最终得到高斯核SVM全A选股模型
的测试集正确率为56.25%,高于线性核(55.66%)、3阶多项式核
(53.75%)、7阶多项式核(50.03%)和Sigmoid核(55.66%)。我们同
时发现支持向量机的回测表现优于支持向量回归
风险提示:通过支持向量机模型构建选股策略是历史经验的总结,存在失
效的可能
相关研究
金工研究/深度研究 | 2017年08月04日
谨请参阅尾页重要声明及华泰证券股票和行业评级标准 2
正文目录
本文研究导读 ........ 4
支持向量机介绍..... 5
线性支持向量机 ......... 5
最大间隔分类 ..... 5
松弛变量6
惩罚系数C ........ 7
支持向量回归 ..... 7
核支持向量机8
非线性分类 ........ 8
核函数 .... 8
γ值 ...... 10
模型评价指标 .......... 10
支持向量机模型测试流程 .........
。。。以上简介无排版格式,详细内容请下载查看