“海量”专题(148)——高频因子在不同周期和域下的表现及影响因素分析

“海量”专题(148)——高频因子在不同周期和域下的表现及影响因素分析
2019年11月21日 08:36 新浪财经-自媒体综合

感知中国经济的真实温度,见证逐梦时代的前行脚步。谁能代表2019年度商业最强驱动力?点击投票,评选你心中的“2019十大经济年度人物”。【我要投票

来源:海通量化团队

在前期报告中,我们从交易逻辑出发,使用分钟、tick以及逐笔数据构建了一系列高频因子,在2019年5月发布周报样本外跟踪以来,取得了优异稳定的表现。

在本篇报告中,我们将考察高频因子在不同周期和域下的表现,以及分析影响因子表现的因素。

1

高频因子计算方法

1.1

因子定义

1.2

回测参数设置

回测区间:2010.01-2019.10;

样本空间:剔除ST、停牌、涨跌停、上市不满6个月、距退市不足1个月的股票;

成交价:次日开盘后半小时VWAP;

交易成本:双边千分之三。

我们在下文中将依次考察原始因子和正交因子的表现,其中正交因子是通过横截面回归剔除行业、市值、非线性市值、反转、换手、特异度、流动性、估值、盈利、成长等因子后得到。

2

月频调仓下的因子表现

2.1

全市场选股

月频调仓下,各个因子在全市场中选股表现如以下图表所示。绝大多数因子月均多空收益差在1.5%以上,rank IC均值在7%以上,其中成交委托相关性因子收益最高。

在剔除了行业、市值等常规因子影响之后,多数因子选股效果明显下降,其中尾盘成交占比因子由于和市值具有负相关性,正交之后选股效果明显提升,因子月均多空收益差从0.97%提升至1.47%,rank IC均值从1.92%提升至4.30%。

我们分别考察因子多头和空头的超额收益,可以发现,多数因子空头贡献更大,其中平均单笔流出金额占比因子多头收益最高,月均超额0.64%。

2.2

沪深300中选股

将选股空间限定为沪深300成分股以后,因子选股能力普遍下降,其中尾盘成交占比因子表现较好,月均多空收益差和rank IC均值分别为0.97%和3.98%。两个成交委托相关性因子多头表现较好,月均超额收益均在0.5%以上。

2.3

中证500中选股

高频因子在中证500成分股中的表现介于全市场和沪深300成分股之间。尾盘成交占比因子同样表现出色,月均多空收益差和rank IC均值分别为1.29%和3.92%。

2.4

因子表现对比

不同选股空间和评价指标下表现最好的因子如下表所示。

3

周频调仓下的因子表现

3.1

全市场选股

周频调仓下,各个因子在全市场中选股表现如以下图表所示。绝大多数因子周均多空收益差在0.5%以上,rank IC均值在5%以上,其中改进反转因子收益最高,周均多空收益差和rank IC均值分别为1.10%和7.76%。

在剔除了行业、市值等常规因子影响之后,多数因子选股效果明显下降,尾盘成交占比因子正交之后选股效果有所提升,但相对月频调仓,提升幅度较小。

我们分别考察因子多头和空头的超额收益,可以发现,多数因子空头贡献更大,其中平均单笔流出金额占比因子多头收益仍然最高,周均超额0.29%。

3.2

沪深300中选股

将选股空间限定为沪深300成分股以后,因子选股能力普遍下降,其中量价相关性和改进反转因子表现较好,rank IC均值分别为5.53%和4.73%。多头周均超额收益均为0.17%。

3.3

中证500中选股

高频因子在中证500成分股中的表现介于全市场和沪深300成分股之间, 量价相关性和改进反转因子同样表现较好,rank IC均值分别为5.82%和5.75%。

3.4

因子表现对比

不同选股空间和评价指标下表现最好的因子如下表所示。

4

复合高频因子

4.1

因子相关性

我们下面考察高频因子相关性,图17展示的是截面因子值相关系数均值及因子rank IC时间序列的相关系数。可以发现,同一级别、同一类别因子之间相关性较高,例如收益分布类因子中的高频偏度与下行波动占比因子值的相关系数和rank IC的相关系数分别为-0.89和0.90。但不同级别、不同类别因子之间相关性较低,例如使用分钟数据计算生成的尾盘成交占比和使用tick数据计算生成的成交委托相关性因子值的相关系数和rank IC的相关系数分别为-0.06和-0.10。

4.2

复合因子表现

我们首先对和常规因子正交后的9个高频因子做进一步对称正交,再按过去12个月因子IC均值加权,构建复合因子。

复合因子在不同周期和域下的表现如以下图表所示。月频调仓下,因子rank IC均值和rank ICIR分别为6.85%和6.13,胜率高达96%。周频调仓下,因子表现进一步提升,rank IC均值和rank ICIR分别为8.48%和10.86。

5

高频因子影响因素分析

在专题报告《选股因子系列研究(五十二) ——基于决策树的因子择时模型》中,我们构建了决策树模型来划分市场环境,并分析因子在不同市场环境下的表现。在本篇报告中, 我们将沿用决策树模型, 探讨高频因子的影响因素。

5.1

模型与择时变量

本文选取了指数收益率、波动率、换手率等14个基础择时指标(指标代码后缀_raw),以及滞后一期(指标代码后缀_lag1)、24期滚动时间序列标准化(指标代码后缀_zscore)、24期滚动时间序列标准化+滞后一期处理后(指标代码后缀_zscore_lag1)的42个衍生指标,总共56个指标作为择时变量,具体如表14所示。分析因子在不同域中的表现时,我们使用相应指数以及成分股来计算指标,例如全样本选股则计算wind全A指数的相关指标,沪深300指数内选股则计算沪深300指数的相关指标。

我们分别选取正交后的因子多空收益、多头超额收益、rank IC、回归溢价beta作为被解释变量,总共构建了216棵回归树,对应不同因子、周期、域下的不同因子收益类型。

决策树又可进一步分为分类树与回归树,本文后续构建的模型主要基于回归树,在训练回归树时使用CART算法。对于回归树模型,最大深度(Max Depth)、节点最小样本量(Min sample leaf)以及分叉最小样本量(Min sample split)都是模型的超参数。在进行模型超参数选择时,使用时间序列交叉验证的方式确定相关超参数。

5.2

单因子回归树

我们在本节中将以高频偏度和成交委托相关性为例展示单因子回归树, 回归结果如图22-25所示。

高频偏度的影响因子主要为指数月最大涨幅与表现最差的10%的个股的平均收益。当指数月最大涨幅低于一定阈值,表现最差的10%的个股涨幅低于一定阈值时,因子表现最好,该情景下共有46个样本,对应因子rank IC均值为4.4%。

成交委托相关性的影响因子主要为个股月收益率截面标准差和个股月收益率均值。当个股月收益率截面标准差极高时,因子月均多空收益差高达6.8%,但仅有3个样本。当个股月收益率截面标准差低于阈值时,个股月收益率均值具有明显的区分效果,均值较低的样本中因子多空收益更高。

由此可见,高频偏度和成交委托相关性因子都是在市场整体表现不佳的环境下能够获得更高的收益,这和我们在前文得到的结论一致,即高频因子选空头能力更强。

5.3

整体表现

高频因子在不同周期、域、因子收益类型下的回归树R方如表15-16所示,月频调仓下的R方分布在20%-30%区域内,周频调仓下的R方分布在10%-20%区域内,模型解释能力普遍较低。

各回归树的特征重要性均值如图26-27所示,月频和周频下最重要的特征分别为跌幅最大的10%个股月均收益,以及涨幅最大与涨幅最小的10%个股的月均收益差。

由此可见,由于高频因子稳定性较强,因子收益难以被外生变量解释, 且多数高频因子选空头能力强,故表现最差的个股的收益对因子收益影响相对较大。

6

总结与展望

我们在本篇报告中考察了高频因子在不同周期和域下的表现,并分析了影响因子表现的因素,得到以下结论与思考。

月频调仓下,在全市场中,成交委托相关性因子表现较好;正交后,改进反转和尾盘成交占比因子表现较好。沪深300成分股中,成交委托相关性因子表现较好;中证500成分股中,改进反转和大单推动涨幅因子表现较好。平均单笔流出金额占比因子多头超额收益较高。周频调仓下,绝大多数因子的选股能力有所增强。高频因子复合后稳定性进一步提升,月频模型rank IC均值和rank ICIR分别为6.82%和6.15;周频模型的rank IC均值和rank ICIR分别为8.48%和10.86。

由于高频因子具有高信息比率和高胜率的特征,基于外生变量构建的回归树模型R方普遍较低。影响较大的择时变量主要是市场中表现最差的一部分股票的跌幅, 这是因为高频因子选空头能力更为突出。

高频因子收益难以被外生变量解释,因此我们建议投资者将高频因子作为alpha因子加入到多因子组合中,以提升组合的信息比和胜率, 降低组合的回撤,感兴趣的投资者可以参考报告《近期指数增强策略回撤原因分析》。关于如何解决因子空头问题,可以采取加权IC打分、因子反向剔除、长短周期组合叠加等思路,我们将在后续报告中作进一步研究。

本文介绍的高频因子均基于交易逻辑,未来将尝试自动挖掘高频因子, 并动态调整因子库。我们在日频数据上已经做了一些尝试,感兴趣的投资者可以参考报告《量化选股因子的批量生产与集中管理》。

6

风险提示

因子失效风险,流动性风险。

联系人:姚石,(021)23219443

免责声明:自媒体综合提供的内容均源自自媒体,版权归原作者所有,转载请联系原作者并获许可。文章观点仅代表作者本人,不代表新浪立场。若内容涉及投资建议,仅供参考勿作为投资依据。投资有风险,入市需谨慎。

选股 相关系数

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 11-22 建龙微纳 688357 43.28
  • 11-22 普元信息 688118 26.9
  • 11-21 华辰装备 300809 18.77
  • 11-21 祥生医疗 688358 50.53
  • 11-21 中科海讯 300810 24.6
  • 股市直播

    • 图文直播间
    • 视频直播间