行业的重新分类及行业轮动策略

行业的重新分类及行业轮动策略
2019年09月21日 09:47 新浪财经-自媒体综合

来源:XYQUANT

行业轮动在权益投资中被广泛关注,是获得相对收益的重要手段。本报告针对行业轮动主要解决以下几个问题:

1、 行业轮动主要有哪些方法?各有哪些优劣?

2、 兴业金工在行业轮动方面之前做过哪些努力?还存在哪些问题?

3、 中信一级行业之间能否根据业务特点以及市场表现重新进行划分和聚类?

4、 各大行业的市场表现影响因子有哪些?如何评价这些因子?

5、 如何结合各决定因子形成行业的择时信号,并形成最终行业轮动策略?

本报告是系统化资产配置系列的第二篇,着重梳理了中信一级行业之间表现的相似性,并对行业重新进行聚类,构建了基于大类行业表现的行业择时方案,进而构建了行业轮动策略,目的是获得相对行业等权组合的超额收益。

此模型于2018年8月初构建,所以样本内数据为2004年12月31日至2018年8月3日,构建好模型之后我们每日跟踪每个因子的表现,并最终形成了真正的样本外的净值曲线(2018年8月4日至2019年9月9日),样本外年化收益率为22%,都远好于基准组合的12%。

风险提示:本报告结论基于历史数据,在市场环境转变时模型存在失效的风险。

 

报告正文

1

行业轮动策略:从行业重新聚类再出发

1.1 行业轮动策略目前主要方法及其优劣分析

传统行业轮动策略一般是基于中信行业或者申万行业进行轮动,一般来说有两种行业轮动方法:一种是基于截面分析,类似于多因子选股,即寻找影响所有行业的共同因子,根据行业因子的打分对所有行业排序,进而选出“优势行业”和“劣势行业”,据此构建多空组合或者纯多头组合;另外一种是基于时间序列分析,即分别构建所有行业的择时模型,根据每期每个行业的择时模型的结果,决定下一期所配置的行业,进而形成行业轮动策略。

 

两种方法各有优劣,前者直接将各个行业因子进行比较,更符合选出“优势行业”和“劣势行业”的基本思想,但由于行业本身通常数量较少(中信一级行业总共29个),且部分行业表现相关性过高(如轻工制造和纺织服装月收益率相关性可达93%以上),所以要找到截面上区分效果好的因子并不容易,所以大多数文献中用的主要因子是动量等价量因子,价量因子虽然长期有正收益,但会出现较大回撤(Momentum Crash),从而增大了轮动的风险。兴业证券金融工程团队在截面模型上于2016年做了改进(见报告《基于不同市场情境下的行业轮动策略》,于明明2016),对截面分析的因子进行了再择时,即将市场划分为不同的市场情景,并在不同的市场情境下选择不同的因子对所有行业进行排序,进而捕捉到不同市场环境下投资者的关注因素)。第二种方法要对每个行业构建择时策略,所以当行业较多时,由于涉及到更多的行业中观因子导致构建策略的难度加大,且由于部分以及行业表现相关性过高,我们认为有必要缩减维度,将市场上的股票按照表现和主营业务重新进行聚类,进而形成有区分度的风格分类,并在新的分类基础上构建择时指标,形成新的风格轮动策略。

 

1.2 行业重新进行聚类

从前面分析可发现,无论是基于因子的截面模型还是基于时间序列的择时模型,行业的分类都变得非常重要,而好的行业分类应该综合考虑行业的主营业务以及行业的表现,本部分先就行业的表现对中信一级行业重新进行聚类,去寻找各个行业之间的联动性,探索是否有进一步聚类的可能性。由于每两两行业间均可以计算相关性,则每两个行业间均可定义“距离”,若有29个中信一级行业,则总共有29*28/2=406个“距离”,十分不方便我们对行业之间的特点进行观测,于是我们引入图论中的“最小生成树”进行“剪枝”。

 

最小生成树

简单来说最小生成树是一副连通加权无向图中一棵权值最小的生成树,具体而言,在一给定的无向图 G = (V, E) 中,(u, v) 代表连接顶点 u 与顶点 v 的边,而 w(u, v) 代表此边的权重,若存在 T 为 E 的子集且 (V, T) 为树,使得

的 w(T) 最小,则此 T 为 G 的最小生成树,最小生成树其实是最小权重生成树的简称。

可见最小生成树提供了一种观察所有行业“距离”的简化方法,将“距离”较远的边去掉,则剩下边即为我们需密切关注的信息。

 

利用最小生成树对一级行业进行精简

我们计算2005年1月到2019年8月的各行业的月度收益率两两相关性矩阵如下:

则两两行业之间的距离矩阵D定义为

其中M为行业个数。

可见当两行业相关性越高,则距离越近,当相关性为1时,表明两个行业走势完全一致,此时定义的距离为0。按照生成最小生成树Kruskal算法,可以生成如下图中信一级行业最小生成树。按照最小生成树的定义,若两个节点之间没有连通的边,则表明两者的距离较远,即相关性较低。从下图可以看出,整个图片大致被“割裂”为四大部分,如计算机、传媒、通信和电子元器件之间互相连通,而与其他行业并不连通,而这四大行业正是通常基本面分析师口中的“TMT”行业,同理房地产、银行、非银行金融便是我们通常称之为的“大金融”行业,同理而其他两大部分分别与“大消费”以及“成长类“行业较为接近,鉴于此我们考虑将行业重新聚类的可能性。

 

1.3 中信风格分类综合考虑了行业的主营业务以及行业的表现

根据前述最小生成树的分析,我们认为有将市场上各行业重新聚集的可能性,综合考虑行业的业务特点,以及充分与基本面分析逻辑匹配,我们本篇报告采用了中信风格分类作为大行业的分类标准。

中信证券风格系列指数以中信证券三级行业分类标准为基础,根据中信为每个三级行业设置的风格标签将股票分为金融、周期、消费、成长以及稳定五个大类,每一个大类指数按照股票流通市值加权得到。

我们提取2018年8月五大中信风格指数的成分股,并计算其各中信一级行业以及二级行业市值占比,发现其风格指数的划分与1.2部分最小生成树各大部分吻合度较高,唯一不同是中信风格指数将“稳定风格”单列,而此类指数历史上大多数时段均跑输市场。

从各大类风格指数的历史表现来看,消费行业长期表现最好,长期能够跑赢市场,而金融行业呈现了较强的脉冲效应,周期行业自2010年之后长期跑输基准。从各大类风格指数超额收益的相关性来看,各大类风格指数普遍较低,其中金融和周期相关性最低,达到了-53%,可能与周期偏进攻,而金融偏防御有关系。

 

2

风格因子择时方法介绍

2.1 择时因子库构建

本报告致力于探索影响各大风格指数的因子,进而分别构建择时模型,可见因子是量化分析的素材,本文我们构建了从逻辑上可能影响各大风格指数的因子库,分别包括实体经济、通胀水平、市场资金流动性、市场风险偏好、板块自身特点以及跨市场信息,具体如下表所示。最终模型中每个风格的择时因子会有所不同,如商品的价格会影响到周期行业的利润,进而影响到周期行业的走势,但未必会对其他板块的走势有显著影响,从而该类指标主要应用在周期风格指数的择时中。

 

2.2 择时因子数据调整

宏观经济因子通常更新频率较低,且通常其发布具备延迟性,本文在处理宏观数据时考虑了宏观因子的发布时间,即为了避免“偷窥”未来数据,当且仅当数据发布后,新发布的宏观经济因子值才可作为择时信号。

本文最终将分别构建定期择时和不定期择时两种模型(实际上定期择时是不定期择时的一个抽样),而由于各类数据的更新频率和更新时间不同,我们需要将所有因子统一到同一频率中,而统一到同一频率有以下两种方式:

 

统一成低频数据:将所有因子都统一变成低频因子,例如尽管我们有日频的Shibor利率,我们依然可以用每个月最后一日或者本月所有日的平均值作为该月度Shibor因子。

统一成高频数据:将所有的因子统一成高频因子,即我们尽管无法获得日频的宏观经济数据,但我们可以通过一些手段将其映射到高频时间点上,如根据信息获得时间,将两次因子更新时间之前填充为前一次更新所得数据的方式获得高频数据便是较为直观方便的一种形式。

 

传统的统一频率方法以第一种为主,这种方法优点是数据整齐,便于在低频基础上实现对资产长期收益的预测,且调仓频率固定,从而可以有效控制换手率。但同时其缺点也非常明显:首先由于宏观经济数据更新并不总是及时且各类指标延迟更新的时间长度未必一致,从而很难做到将各个因子在时间维度上很好地对齐;其次此时信号很难做到及时性,如新的数据发布后,如果没到我们调仓的低频时点,其信息就无法准确及时的反映到模型中去,鉴于此我们将所有因子统一成高频因子(本文调整到日频),因子两次更新期间的数据用前一次数据填充。

 

3

因子信号生成机制及其合成

3.1 三分位法t统计量构造机制

从策略表现角度,我们追求的是策略夏普比率足够大,即单位风险所带来的收益足够大。对于单个因子来说,为了衡量其预测效果,我们采用三分位点法作为信号生成机制来确定未来的投资信号。

所谓三分位点方法,是指可以依据指标的观察样本数据确定上下三分位点,结合该指标的方向逻辑,确定下一期的头寸方向(分别对应看多,看平和看空三个方向),进而分析在不同分位点情景下市场下一期收益率的统计差异,其差异程度可以通过以下统计量衡量:

其中:

t统计量越大,说明该因子发出看多和看空信号未来收益的差异越明显,其预测效果越好。我们用前面构建的因子库的数据进行测算,发现t统计量的值与我们追求的夏普比率(不考虑手续费和交易摩擦)相关性非常高,从而可以用t统计量是否显著作为因子预测效果的重要衡量指标。

 

3.2 择时因子叠加方法介绍

由于我们所用因子库中因子较多,每一大类因子“同质性”可能较强,则各因子之间择时表现相关性可能较高,从而各个择时因子信号的叠加用等权结合方式(报告《CTA策略系列报告之五:商品量化基本面研究框架的探索之螺纹钢》于明明 2018-01-07)未必妥当,本报告采用了因子聚类再等权的方法,即假设某风格择时的有效因子因子共有N个,每个因子发出的信号分别为wi,i=1,2,…N, 则最终信号的确定具体步骤如下:

Step 1: 随机在N个因子中取一点作为初始值,采用Kmeans方法将(所有N个因子按照“correlation”的距离定义方式)分成3类Uk,k=1,2,3。

Step 2:每一大类中各因子的信号采用该大类中因子信号等权获得:

其中|Uk|为Uk中因子的个数。

Step 3:最终该风格的择时因子信号为三大类信号的等权:

Step 4:重复Step1-Step3 1000次,将所有获得的Sign算术平均,即为该风格最终的择时指标,此指标越大,表明越看好该风格未来表现。

 

4

择时以及行业轮动的样本内外表现

4.1 各风格指数样本内外择时表现

此模型于2018年8月初构建,所以样本内数据为2004年12月31日至2018年8月3日,构建好模型之后我们每日跟踪每个因子的表现,并最终形成了真正的样本外的净值曲线。

由于本报告的择时标的是每个大类风格的超额收益率(相对于等权配置),我们分别计算了样本内外对各大类超额收益率择时的年化收益和收益波动比,可见样本内对各大类我们均有非常好的表现,样本外表现最好的大类风格指数为周期、成长以及稳定三个风格。

 

4.2 基于各大类风格指数择时的风格轮动策略

基于3.2中各个大类风格的打分(Sign),在每个调仓节点对所有大类风格打分进行降序排列,分数越高表明模型越看好该类风格未来表现,我们分别计算选择不同排序的风格指数的策略表现。具体而言,若打分排序为1,表明每个换仓节点选择当前所有风格指数中打分最高的进行配置,若观测及换仓频率为日频,我们称为不定期调仓,若每月底进行打分排序并决定下个月的持仓,我们称之为月频调仓,可见月频调仓是日频调仓的一个抽样。

 

从下表可以看出,打分排序越高的风格指数表现越好,随着打分次序的降低,年化收益率和最大回撤呈现了很好的单调性。排名第一的指数在不定期调仓条件下,样本内年化收益率可达到50.2%,远高于其他排名指数以及五大风格等权表现,回撤也更低,值得一提的是样本外同样表现出色(注意这是真正的样本外),年化收益为19%,而同期等权组合年化收益为14%。

由于月频调仓是日频调仓的一个抽样,若每月底去观测各个指数的打分情况,确定下个月所配置的指数,月中间不再进行调仓,此时轮动收益依然表现出色,样本内打分第一名的指数年化收益率为43%,样本外年化收益率为22%,都远好于基准组合的表现。

 

风险提示:本报告结论基于历史数据,在市场环境转变时模型存在失效的风险。

 

免责声明:自媒体综合提供的内容均源自自媒体,版权归原作者所有,转载请联系原作者并获许可。文章观点仅代表作者本人,不代表新浪立场。若内容涉及投资建议,仅供参考勿作为投资依据。投资有风险,入市需谨慎。

最小生成树 中信

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 10-14 渝农商行 601077 7.36
  • 10-09 交建股份 603815 5.14
  • 09-25 科博达 603786 26.89
  • 09-25 豪尔赛 002963 --
  • 09-25 晶丰明源 688368 --
  • 股市直播

    • 图文直播间
    • 视频直播间