中国量化私募产品系列报告:股票量化

中国量化私募产品系列报告:股票量化
2018年08月15日 18:23 新浪财经-自媒体综合

  中国量化私募产品系列报告:量化私募产品第四季——股票量化

  来源:华宝财富魔方

  华宝证券研究报告 分析师/奕丽萍(执业证书编号:S0890515090001) 研究助理/吴昱璐

  ◎ 投资要点:

  股票量化策略。本文只探讨狭义的股票量化策略——量化择股+量化择时,即:基于大体量的数据分析、利用科学方法形成数学模型、结合计算机技术构建现货组合,通过灵活的仓位调整实现稳健收益。考虑国内空券的非便利性,股票量化更多体现为多头头寸,这就使得国内股票量化策略更多的是争取相对指数的超额收益。

  股票量化评价的特殊性。考虑传统产品评价思路与股票量化策略的实践特点,对股票量化策略的评价可以沿着“净值绩效——>区分能力——>盈利模式——>风格暴露”的链条进行,本质上是为了逐步接近策略获得收益的真实逻辑。

  股票量化的风险暴露分析。股票量化策略通常持股分散、换仓频率较高,简单的持股集中度和行业配置统计难以捕捉产品的真实风险暴露。因此,有必要通过对高频持股信息的整合,集中梳理产品在有限风险因子上的暴露情况,了解产品主动头寸的主要风险暴露,进而推导产品适宜的行情,为风险管理提供支持。本文以某私募资产管理产品B为例,从风险暴露的视角探讨其股票主动头寸的损益。

  1. 股票量化策略

  “量化”和“对冲”这两组概念经常成对被市场提起,实际上两者并无必然联系、也并非必须同时存在。在此前的《量化私募产品第三季——股票多空》中,我们探讨的股票多空策略强调对冲技术的应用,不区分现货的主动或量化选择。而在本文中,我们将更多的强调“量化”而非“对冲”。

  广义而言,任何运用到数理分析技巧的股票策略,无论多空,都可以被纳入股票量化的策略范畴。依此,股票量化策略与股票多空、股票市场中性等策略容易产生重合区域,典型的如股票配对交易策略,利用统计套利的结果博取两证券或多证券价格区间异常波动后的回归,从手法上而言既可以纳入股票量化,又可以纳入股票多空。为了与此前的股票多空区分讨论,本文重点探讨非重合区域。

  本文只探讨狭义的股票量化策略——量化择股+量化择时,即:基于大体量的数据分析、利用科学方法形成数学模型、结合计算机技术构建现货组合,通过灵活的仓位调整实现稳健收益。考虑国内空券的非便利性,股票量化更多体现为多头头寸,这就使得国内股票量化策略更多的是争取相对指数的超额收益。当然,假设基金投资者在市场强周期的起点购买股票量化产品,或者在弱周期中购买了超额收益足够丰厚的股票量化产品,同样可以实现绝对收益目标,不过上述情景更多是偏理论的。

  1.1. 股票量化VS股票主观

  与市场上占比最大的传统股票主观策略(主要指传统股票多头主观策略)相比,股票量化策略的优势体现在几个方面:

  1)覆盖面广。传统股票主观策略的投资标的集中度相对较高,考虑到全市场全行业覆盖的股票研究需要大量的人力物力,实现难度较大,投资经理往往选择较为擅长的某些行业或公司进行深入研究,包括公司的基本面、财务状况、发展前景等多个方面,从而挖掘出具有投资价值的投资标的;而对于股票量化策略,由于主要基于海量数据分析与模型构建,并且是通过信息技术实现,可以对大量股票运用数量化方法筛选出投资机会从而构建投资组合。因此与传统股票主观策略相比,股票量化策略的投资组合中往往投资标的较为分散,个股仓位相对较低。

  2)风险分散与控制。基于上一点,股票量化策略投资标的的相对分散化同时也能带来风险分散的效果,由于单票在投资组合中的权重较低,组合受单票上涨或下跌的影响相对较小。此外,投资经理在量化策略的模型构建时,都会经过大量严谨的数据测试,同时会在实际投资中设置合理的风控指标,开发成熟的系统可随时监控仓位变化,一旦出现异常可迅速做出反应。

  3)投资收益稳定。基于上一点,由于风险分散与严格的风险控制,股票量化策略受市场极端或异常情况的影响有限,投资收益相对较为稳定。此外,与传统选股策略相比,股票量化策略始终遵循一定的数理逻辑,从而有效的避免了主观交易的弱点,即不易受投资者主观情绪的扰动而做出非理性的投资决策,收益稳定性相对较高。

  与海外相对成熟的量化投资体系相比,国内的股票量化投资起步较晚,初期策略构建多为借鉴海外已有的成熟模型,并在此基础上进行更加适应中国资本市场的策略调整。在私募基金领域,不少投研人员为海外回国人士,策略普及速度远高于其他类型机构。

  2012年以来,国内量化对冲产品进入高速增长阶段,股票量化作为其中主要也是早期的策略分支,同样经历了产品数量和规模的双发展。2014~2015年,私募基金阳光化伴随持续上涨的牛市行情进一步助推了包括股票量化在内的所有策略的产品化进程,尽管在快速上涨的行情中股票量化绝对收益率中位数不敌股票主观。2016年在熔断、熊市的连续冲击下,股票类策略整体表现平平,但相较于股票主观策略,股票量化策略更显稳健。但在紧接着的2017年,市场风格分化明显,少数热点白马股上涨,“二八行情”长期持续的背景下,股票量化策略再度不敌股票主观策略,遭遇难以盈利的尴尬,在与指数的对比中也是大幅跑输基准指数,原因可能是策略调整未追上行情切换以及因子收益思路与行情的误匹配。2018年以来,市场连续下探,尽管收益均在水平线下,但股票量化风险控制优势再次显现,行业平均亏损较股票主观而言有明显优势。历年统计结果显示,股票量化较股票主观而言业绩波动范围更窄,主要的优势在于稳定而非搏高。

  尽管对于2017年至今股票量化策略的表现能给出相应的解释,但市场对于股票量化策略的质疑之声迭出,质疑多集中在对该类策略“趋同性”和“有效性”的担忧。模型或多或少都采用了价值类、量价类等相同的因子是否使得量化投资空间太“拥挤”?依赖于相似的统计学方法来寻找Alpha收益来源是否会导致策略相似度太高?

  为了验证“趋同性”是否存在,我们分年度对2015~2018年上半年满足条件的股票量化策略产品两两之间周收益率序列的相关性进行了统计,并取所有相关系数的平均数作为该年度相关系数情况。考虑到相同管理人发行的产品之间策略相似度较高的可能性较大,因此对于同一管理人仅随机挑选一只产品进行统计。

  统计结果显示,从相关度的角度看,股票量化策略产品并非如大家所质疑的一样相似度很高,各年度同策略产品间的相关系数基本维持在0.2~0.3左右,处于较低水平,同时与股票主观策略相比并非处于劣势,相反,除了2017年之外,其相关度都要低于股票主观策略。当然,难以忽略的一点是,随着行业进入者的增加,股票量化的相关系数是逐年增加的,而股票主观则较早期有明显下降。

  当然该统计也存在一定的缺陷,从表格中很容易看到,两类策略的产品数量差异较为悬殊,股票主观策略类产品数量远多于股票量化类产品,因此两类策略相关系数的比较结果参考意义有限。

  1.2. 股票量化分类

  在多空技术都允许的情况下,股票量化策略主要可以分为两大类:量化选股和量化择时,其中量化选股又可分为广义多因子选股和技术分析选股等。

  广义多因子选股的主要逻辑是对证券/证券组合合理收益率的预测。当前常见做法是在经典定价模型基础上做中国化延展。模型间的主要区别是因子的选择、因子共线性等问题的处理技巧、因子组合方案等。本文将风格轮动、行业轮动等模型视为对特定几类因子的投资,纳入广义多因子选股,尽管其中蕴含了量化择时技术。

  技术分析选股的主要逻辑是基于市场资金行为对证券进行交易。当前常见做法偏向图形交易或主力资金跟踪交易。模型间的主要区别是图形/指标交易习惯、盘口分析方法论等。随着计算机量化的普及,图形交易等思路已经逐步通过计算机语言实现,并纳入因子库,这使得传统的技术分析选股逐渐成为广义多因子选股的一部分。

  广义多因子选股框架若要适用不同二级市场品种,如债券、商品期货等,需要做较大的模型调整,因为不同品种的定价逻辑差异很大。即使同样是股票品种,相同的因子对于不同的行业而言往往效果也是南辕北辙。而技术分析选股适用不同品种时,需要做的调整相对少,原因是研究标的本质上都是资金情绪与资金行为。

  除此之外,舆情选股、机器学习等方法论近年来日趋火爆。我们理解,舆情选股本质上是捕获市场上关于特定股票的情绪与信息,是对多因子模型的补充,实际上我们看到很多大数据公募基金产品正是将舆情结论作为股票打分依据之一。而机器学习不是对选股信息源的补充,而是使得定价模型具有自适应性。

  关于T+0交易:许多T+0交易本质上是统计套利,通过现货基础持仓或融券打通卖空路径,观察不同股票子组合(子组合可由单票构成,也可由篮子股票构成)之间的价差偏离情况,当价差偏离到达一定阀值时,通过买卖组合操作实现对价差回归的看法。前文我们提到统计套利属于多策略重合区域,因此本文不做展开。

  本文所指量化择时是对现货仓位或风险敞口的高低调整。分析的依据丰富,包括宏观基本面研究、中观行业景气度研究、流动性研究、市场情绪研究等。择时的对象可以是大类资产,也可以是大类资产下属的细分资产,或者是合成得到的资产。

  量化选股与量化择时并非始终可以完全切割,典型案例是在多因子选股中,因子赋权既是量化选股的构成,也属于广义量化择时。

  1.3. 深度学习选股策略

  随着机器学习理论与技术的日益成熟,其在量化投资上的应用也越发深入。同样是基于大量历史数据构建选股模型,传统的多因子选股模型在模型搭建,尤其是因子选择过程中包含较大的主观成分,仍需依靠投资经理对市场行情的基本判断来预选因子,而机器学习选股模型与其的差异在于模型构建与因子筛选过程主要依靠数据挖掘技术自动完成。

  尽管目前机器学习技术在国内权益市场投资上的应用还处于起步阶段,市场上仍以传统的多因子选股模型为主,但也已有不少私募管理人将机器学习模型应用到实际投资中。目前应用较多的模型主要是相对较易实现的,例如决策树模型。它主要基于归纳学习法的逻辑对数据进行分类和预测,其优势在于分类规则明确,逻辑关系简单易懂,数据计算量相对较小,相对较容易实现。但这样的优势同时也会带来准确度欠缺、稳定性较差或过度拟合等问题。因此管理人会选择将其作为辅助工具来应用。

  除了决策树之外,还有其他更加复杂的机器学习选股模型,比如深度学习多因子选股模型(神经网络模型)。该模型主要通过对大量历史数据(训练集)进行不断的自学习以寻找输入项与输出项之间存在的内在规律从而建立预测模型。模型的输入项即为各类因子,因子种类与规模因子、动量因子、估值因子等传统的选股因子无异,输入因子的数量限制较小,而输出项即为预测结果,例如未来股价的变动等。输入项与输出项之间不像传统的多因子模型主要依赖线性方程,而是在输入层与输出层之间存在构成网络的若干个起辅助作用的隐藏层,相邻两层的每个神经元之间都存在联系,对神经元之间关系构成的参数确认都是训练优化的过程。其中,隐藏层的数量和每层神经元数量等模型结构参数需要提前确定,一般会选定若干候选参数组合或范围,通过训练筛选出最佳模型结构。

  深度学习选股策略的核心在于对训练集数据的反复训练以获得最优模型,该策略的高效运行依赖于多个方面:

  (1)模型涉及海量数据的处理与运算,对计算机等硬件设备、算法及其优化的要求很高;

  (2)考虑到对所有模型结构组合依次训练而择优不实际,模型结构的优化一般采用网格搜索或随机搜索等方法对提前选定的候选参数组合或范围依次进行训练,选出最合理的结构参数组合。因此,对模型构建者选择候选参数组合的经验及能力要求较高,最大程度对候选范围的合理缩小可以大幅减少模型结构参数确认的训练次数从而提高运行效率。

  此外,与传统多因子选股模型类似的,大体量、高质量的历史数据是模型构建的前提,因此原始数据异常值及缺失值的处理、因子标准化等预处理工作也是必须的。若策略需要,也可对模型进行行业中性等处理,即在训练集数据中将相关因子剥离从而减小行业轮动等情况对预测模型的影响。

  深度学习多因子选股模型的优势在于:

  (1)自学习能力强,自动化程度相对较高。虽然在模型结构的初步构建上仍需依靠一定的主观经验确定结构参数范围,但结构优化及因子筛选过程均由计算机自动完成,因此与传统多因子选股模型相比,该模型受主观因素影响相对较小。

  (2)优化能力较强,容错率较高。与传统多因子选股模型相比,深度学习模型不局限于线性关系的构建,引入了非线性关系的拟合,模型结构复杂度更高,同时其有系统化、智能化的信息处理系统,在隐藏层的辅助作用下,若基于足够的训练集数据,模型最终的拟合程度较好。

  (3)对输入选股因子的数量限制相对较少。对于传统多因子选股模型来说,模型构建前期就需要预选合适的选股因子,这也是模型包含主观因素最多的部分,同时考虑到过度拟合的可能性,选择因子数量不宜过多。而深度学习模型在输出结果不变的情况下,模型无需预选因子,输入层可包含的因子个数不受限制,甚至可达上百个选股因子,只需确定隐藏层和各层节点数量,模型会通过自学习进行因子筛选。当然,深度学习模型不可避免地同样存在过度拟合的可能性,可通过嵌入Dropout等技术在训练过程中降低模型的过度拟合。

  同时,深度学习多因子选股模型也存在一定限制。最直接的就是该模型的运行需要更高要求的计算设备以及更多的运算时间,如何能在条件允许的情况下最大程度提高运算效率是策略开发者最关心的问题之一。此外,模型内部网络结构的复杂性也使得模型的运行过程难以用常规经济学逻辑来解释,因此相对于传统多因子选股模型来说,该模型较难被理解。

  2. 国内产品现状

  2.1. 股票量化产品典型

  如前所述,股票量化由量化选股和量化择时两部分构成。从各家私募产品管理人的能力建设和绩效结果看,目前国内股票量化策略的能力禀赋主要在量化选股端,尤其是广义多因子选股领域。常见的因子有贝塔因子、动量因子、规模因子、波动因子、成长因子等,每类因子可由多个描述性变量构成。

  从交易频率看,国内股票量化策略可分为低频和中高频,与使用的因子频率关联度较大。部分股票量化策略极大沿袭了原主观投资的思路,注重低频基本面因子的使用,换手率极低,年换手一般在5倍以内;而部分股票量化策略注重多而全的因子组合,囊括常见的十余类因子,换手率一般,年换手一般在10倍以内;还有部分股票量化聚焦于量价等高频因子的组合,换手率偏高,年换手可达几十倍甚至上百倍。在无对冲的情况下,尽管个股的系统性风险始终存在,但通过不同性质的因子组合可以有效降低市场行情对股票组合的不利影响。

  以某私募资产管理产品A为例,该产品主打中高频股票量化策略,以巨量数据和信息为支持,通过对价量、舆情等短期因素的把握,在2017年下半年连续把握了周期行情、次新行情、芯片行情等。尽管在2018年2月~3月的2次市场下跌中略有回撤,但回撤幅度远低于市场整体回撤,且由于较丰厚的超额收益积累,最终业绩曲线较为稳健。

  观察区间内,产品A绝对收益28.76%,最大回撤-8.39%,夏普比率1.38,卡玛比率2.92。

  与同期其他股票量化产品相比,产品A的绝对收益与两大性价比指标——夏普比率、卡玛比率均位列前10%分位,显示产品在拥有较高风险收益性价比的基础上,创造了较好的绝对收益。

  若将产品放入同期股票多头产品对比,则产品的业绩优势更为凸显。除前述指标外,最大回撤也跻身前10%分位,年化波动率的相对表现也有所提升,这表明产品A作为股票量化策略的典型,较传统股票多头而言,显示了对风险的更大关切。

  2.2. 股票量化评价的特殊性

  国内股票量化策略在实践中虽然并行开发、储备量化选股策略与量化择时策略,但有限的对冲工具加重了对量化选股策略的关注,尽管在量化选股策略内部依然无法回避局部择时问题。这使得国内股票量化策略往往主要表现为一篮子股票的频繁换仓。考虑传统产品评价思路与股票量化策略的实践特点,对股票量化策略的评价可以沿着“净值绩效——>区分能力——>盈利模式——>风格暴露”的链条进行,本质上是为了逐步接近策略获得收益的真实逻辑。

  (1)净值绩效:经风险调整的超额收益

  做空工具稀缺性使得国内股票量化策略更多的是争取相对指数的跑赢,超额收益自然成为衡量股票量化策略的重要指标之一。

  超额收益通常有两种表达方式,一是直接扣减基准收益以后的剩余收益率,即不做风险调整的超额收益率;二是考虑产品收益率承担的风险,即做风险调整后的超额收益率。其中对产品收益率做风险调整既可以假定产品简单剩余收益与风险呈线性关系,也可以基于资本资产定价模型对产品做收益预期,我们选取前者做示例。

  公式表达如下:

  简单超额收益是基于收益视角的单维尺度,对于多数专业投资者而言,风险收益性价比指标的应用频率很高,基于简单超额收益的计算,延展开可以得到各类收益风险比率指标。由于强调的是相对基准指数的能力,此时信息比率比夏普比率更适宜评价股票量化策略。

  除了总体的超额收益率以外,还可以通过上行/下行捕获率了解股票量化管理人在不同行情中的简单超额能力。其中,上行捕获率捕捉基准收益率为正时,基金业绩收益率均值与基准收益率均值的比率。下行捕获率捕捉基准收益率为负时,基金业绩收益率均值与基准收益率均值的比率。上行捕获率越大、下行捕获率越小,说明投资经理既可以把握上涨行情,又可谨慎处理下跌行情,简单超额能力越好。

  (2)区分能力:量化择时+量化选股

  国内股票量化策略更多是多因子选股的思路,当然,有时也叠加量化择时模型。如前所述,多因子选股模型本质上也无法回避局部择时的问题,但为了更清晰的区分,我们将量化择时界定为因子轮动以外的择时,典型如对大类资产的择时等。

  据此,可以探讨的一种分析路径是,先对产品整体做择时效果的评估,然后就权益仓位部分做风格暴露和行业暴露的测试,一则检验择时模型的有效性,二则模拟接近投资经理获利的仓位暴露。

  其中,对产品整体做择时效果的评估,近似于衡量大类资产层面的配置收益,可参考我们此前发布的专题报告《私募基金配置/选择分析的适用性思考》。

  (3)盈利模式:频率+能力

  介于产品净值与底层数据之间,可以通过策略表征了解产品的盈利模式。预期产品表现的一个经典公式是,产品最终表现出来的信息率与投资策略的广度、基金经理的预测能力是相关的:               

  从策略表征看,股票主观策略往往更强调预测能力的提升,通过对公司基本面与上下游产业链的深度挖掘等方式实现,通常表现为IC值较高、BR较低,也即高胜率、低频率。而股票量化策略往往更强调交易机会的提升,通过扩大预测范围、缩小预测间隔等方式实现,频率的提升更有利于复现统计规律,因此表现为BR往往较高。

  在常见的多因子选股模型中,主要的预测体现在对下一期因子表现的预测上,理论上可同时记录下预测的结果与实际的结果,进而了解股票量化策略的IC与BR,知晓产品获利的来源是频繁的预测还是出色的预测能力。而不再仅仅基于产品最终的净值曲线来评价。

  当然,要获得管理人的“上述配合”在实操中是比较困难的,而且不少私募投资经理也仅限于通过最终的业绩曲线来确定和管理模型。

  (4)风险暴露:推导产品适宜的行情

  股票量化策略通常持股分散、换仓频率较高,简单的持股集中度和行业配置统计难以捕捉产品的真实风险暴露。因此,有必要通过对高频持股信息的整合,集中梳理产品在有限风险因子上的暴露情况,了解产品主动头寸的主要风险暴露,进而推导产品适宜的行情,为风险管理提供支持。

  2.3. 股票量化的风险暴露分析

  我们以某私募资产管理产品B为例,从风险暴露的视角探讨其股票主动头寸的损益。产品主动股票头寸在观察区间的净值表现如下:

  观察区间内,某私募资产管理产品B累计收益率10.17%,区间单日盈亏比为1,最大单日盈利为4.07%、发生在月中,最大单日亏损-3.01%、发生在月初。

  头寸的风险因子主要有两类,一是行业因子,二是风格因子,以下我们就产品在上述两类因子中的暴露做进一步分析。

  STEP1:观察产品行业因子暴露

  行业因子暴露方面,某私募资产管理产品B的主动头寸在电子、汽车、非银金融、银行等行业上有明显的正向暴露,表明产品B在上述行业中的配置较多。从观察区间历史看,经历期初的持仓调整后,产品B在电子、汽车、非银金融三个主要行业上的暴露处于相对稳定的区间,保持在0.1~0.2区间,显示产品B在上述三个行业上的配置是相对稳定的。

  同时,产品B在主要行业暴露与次要行业暴露间的差异性是相对较小的,显示产品B在有暴露的行业领域内配置是相对均衡的。

  值得注意的是,在这一步的分析上,对主动头寸行业暴露的分析实际上与简单的行业持仓分析结果给出的信息是一致的。前提是保持对冲工具是否纳入分析的一致性,即同时仅分析现货或者同时结合仓位中的对冲品种。

  STEP2:行业因子暴露的收益贡献

  行业因子收益贡献上,对某私募资产管理产品B形成正向收益贡献的行业因子主要是汽车、电子、非银金融、计算机、银行等。其中,汽车、电子、非银金融的正向贡献最为显著,这是令人欣喜的,说明产品B在行业因子上的主要暴露也正是其行业因子收益贡献的主要来源。

  观察产品B三个主要行业因子的历史收益贡献,发现在观察区间内,电子行业因子累计贡献由期初的微亏逐渐转正,最终累计贡献近3%的收益率,与非银金融因子近似。而汽车行业因子累计贡献最大,超过5%。

  STEP3:观察产品风格因子暴露

  风格因子暴露方面,以本文搭建的七个风格因子为例,私募资产管理产品B的主动头寸在规模、估值、成长、非线性规模上的因子暴露为正,而在动量、波动、贝塔上的因子暴露为负。

  从观察区间历史看,经历期初的持仓调整后,产品B在规模、估值、成长三个主要风格因子上的暴露趋于稳定。其中,规模因子暴露稳定在1以上,表明产品B在规模上有明显的正向偏离,偏好大规模个股,而在估值和成长上的正向偏离表明产品B偏好低估值、高成长个股。

  注意:我们以因子模型解释私募资产管理产品的风险暴露,这些因子并不一定是投资经理的收益因子,只是基于我方视角试图解释风险的因子。

  STEP4:风格因子暴露的收益贡献

  风格因子收益贡献上,对某私募资产管理产品B形成正向收益贡献的风格因子主要是动量因子、估值因子、波动因子,而形成负向收益贡献的风格因子主要是规模因子、贝塔因子。

  令人沮丧的是,产品B在规模因子上有较大的正向暴露,而观察区间内该因子表现不佳。而同样正向暴露的估值因子和成长因子在观察区间内也仅贡献了相对微薄的收益。

  产品B在风格因子上相对成功的是:偏好具备反转效应的个股带来了显著的正向收益回报。

  此外,特质因子收益贡献不佳表明产品B的选股能力并不如愿。

  (感谢实习生余宏伟对本文的贡献)

新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

免责声明:自媒体综合提供的内容均源自自媒体,版权归原作者所有,转载请联系原作者并获许可。文章观点仅代表作者本人,不代表新浪立场。若内容涉及投资建议,仅供参考勿作为投资依据。投资有风险,入市需谨慎。

责任编辑:常福强

量化投资 因子 选股

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

Array
Array

股市直播

  • 图文直播间
  • 视频直播间