多因子系列之一:多因子选股体系的思考 | 量化专题报告

多因子系列之一:多因子选股体系的思考 | 量化专题报告
2019年01月16日 13:34 新浪财经-自媒体综合

科创板呼之欲出!哪些企业将率先登陆科创板?谁是投资者心目的科创典范?逾三百家公司角逐科创板潜力百强(名单),【点击寻找科创先锋>>

从本篇报告开始,我们将开启多因子报告系列,为投资者全面展现我们多因子体系的方方面面。本篇是系列报告的第一篇,主要就传统多因子模型中容易忽视的问题提出一些思考,并给出部分解决方案。未来我们会在后续的系列报告中一一揭开其他模型的面纱,欢迎投资者关注。

我们构建并重新审视了多因子体系,针对性地补充了因子配置、因子改进和尾部风险等模型,形成了我们自己的多因子选股体系。本篇报告主要讨论以下几个问题:

1)多因子选股系统的工程化构建有哪些值得思考的地方?如何保证系统的可靠性、可用性以及灵活性?

2)传统的风险模型对风险的估计是否准确?模型为什么会有低估风险的问题?如何解决这些问题?

3)组合优化与回测如何有机结合?能否构建一个有效的工具来进行组合管理?

4)因子测试有哪些方法?各个方法之间有何差异?

5)除了投资者熟知的策略单期收益归因,多期收益归因如何完成?如何进行风险归因?归因过程中有哪些容易忽略的问题?

多因子体系已日趋成熟,但对于其细节的思考依然很有意义。正所谓细节决定成败,通过深入地思考模型的各个细节,我们能够更精确地把握策略的收益和风险特征,获得更稳定的策略表现。

一、国盛多因子选股体系概览

如下图所示,我们的多因子选股体系总的来说分为两大数据库和三大系统:即原始数据库和因子数据库,风险模型、Alpha模型、组合管理三大系统。

两大数据库:以Wind底层数据库为主要数据源,通过一个批量更新程序和在线更新程序进行数据更新,构建了原始数据库和因子数据库,以日级别为单位更新。

三大系统:基于这些数据,我们在上层构建了三大子系统:风险模型、Alpha模型和组合管理系统。其中Alpha模型又包括四个子模块,即因子挖掘与改进、因子检验与回测、因子配置算法和尾部风险Alpha模型。


二、基础数据库与研究平台构建

2.1 基础数据的构建有哪些注意点?

首先选择数据源,我们希望获取数据具备以下几个特征:可靠性、及时性、可回测性。其次涉及数据结构,将数据按照静态表、状态表和流量表进行划分。针对不同类型的数据表,采取不同的更新方式。

对于基础数据,我们讨论了以下问题:源历史数据不可得问题和数据被修改问题;关于数据存储逻辑级别问题;关于爬虫等相对不稳定的数据源的使用问题。

2.2 因子数据构建有哪些问题值得思考?

因子数据库的设计面临以下几个问题:

1).如何设计数据库,使得因子具有较强的可扩展性,即每次增加新的因子,数据结构无需做过多改变?

2).如何设计数据库,使得因子存取速度较快,从而满足因子研究的需求?

3).如何设计数据库,使得同类型因子的数据结构更相近,从而在逻辑上表现出因子数据的美观性?

除此之外,我们还进一步讨论了因子存储模式问题和批量计算问题。

三、风险模型

3.1 风险模型的构建中有哪些问题?

多因子风险模型的构建方法已经有很多公开文档的介绍。但是,我们自己在构建风险模型时面临很多细节问题的处理。同时,如果直接参照文档中的参数和方法,构建的风险模型并不准确。

我们思考了在构建风险模型中各个环节的细节处理方式,同时对风险计算方法中不合理的地方进行了改进。

3.2 为何实现的风险总是要高于预设风险呢?

在实际投资中,我们经常会发现组合实际的跟踪误差总是会高于预定的目标。通过对风险进行归因,我们发现以下几点可能的原因:

1).风险模型低估风险

2).组合权重与暴露月中的变化

3).组合残差收益与因子收益的相关关系

4).策略风险(Strategy Risk)

5).Alpha因子与风险因子的不一致问题(Factor Alignment Problem)

我们详细的对这些问题进行了阐述,并给出了可能的解决方案。

四、因子测试

4.1 因子测试整体框架怎样构建?

基于搭建的数据库和多因子平台,我们构建了一套统一的因子测试系统,便于统一输出完整且可比较的因子测试结果。因子测试流程主要包括:

1).因子处理:包括因子计算,缺失值处理,去极值,标注化和中性化;

2).因子测试:信息系数(IC/RankIC等)、分组测试和回归法测试;

3).结果分析:针对上一步给出的结果分析因子的表现。

4.2 因子测试方法有何差异?

不同因子测试方法在刻画因子表现方面存在各自的优劣势,我们将其总结如下。

五、组合优化与回测

我们基于开源框架构建了自己的回测平台,并将组合优化模块嵌入平台之中,实现了一个方便的基于组合优化的回测工具。

在构建回测系统的过程中,我们进一步思考了成本,可成交性等问题,使得回测的结果能够更加贴近实盘交易。

六、业绩归因

6.1 多期收益归因与单期收益归因相比有哪些要注意的点?

在面对多期收益归因时,需要注意的问题有:

1). 在完成单期收益分解,并将各分解项累乘得到多期收益后,R≠∑F+ϵ,可用平滑系数配平组合总收益与各分项收益。

2). 多期组合收益、因子收益和残差收益累乘时,存在冗余项,使时序上残差收益与因子收益间存在相关性,需要进一步剥离。

6.2 如何对风险进行归因?

组合风险的来源可以拆分为共同风险和特质风险,且分别由三个因素驱动:

组合在因子上的暴露;因子的波动率;因子与组合收益的相关性。

只有当组合在该因子上暴露较大,而因子自身波动率高,且与组合收益高度相关的时候,因子对组合风险的贡献较大。

风险提示:以上结论均基于历史数据和统计模型的测算,如果未来市场环境发生明显改变,不排除模型失效的可能性。

本文节选自国盛证券研究所已于2019年1月15日发布的报告《多因子系列之一:多因子选股体系的思考》,具体内容请详见相关报告。

殷明

S0680518120001

yinming@gszq.com

刘富兵

S0680518030007

liufubing@gszq.com

李林井


lilinjing@gszq.com

丁一凡
dingyifan@gszq.com

特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。

 

重要声明:本订阅号是国盛证券金融工程团队设立的。本订阅号不是国盛金融工程团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。

本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。

 

版权所有,未经许可禁止转载或传播。

免责声明:自媒体综合提供的内容均源自自媒体,版权归原作者所有,转载请联系原作者并获许可。文章观点仅代表作者本人,不代表新浪立场。若内容涉及投资建议,仅供参考勿作为投资依据。投资有风险,入市需谨慎。

选股 因子 模型

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 01-23 西安银行 600928 --
  • 01-23 恒铭达 002947 --
  • 01-17 华致酒行 300755 16.79
  • 01-16 新乳业 002946 5.45
  • 01-16 威尔药业 603351 35.5
  • 股市直播

    • 图文直播间
    • 视频直播间