兴业金工团队:基于专利分类的科技动量因子选股研究

兴业金工团队:基于专利分类的科技动量因子选股研究
2019年06月26日 08:20 新浪财经-自媒体综合

  【兴业金工徐寅于明明团队】基于专利分类的科技动量因子研究

  导读

  1、科创板目前正如火如荼,对一个企业的科技创新能力的衡量成为越来越多的投资人关注重点。继专利数据领域的第一篇报告《从中国心到中国芯-由贸易战引发的专利选股有效研究》之后,我们在第二篇深度研究中,以专利IPC分类数据为基础,通过引入科技关联度这一重要概念,构建了科技动量因子,选股效果颇佳。

  2、针对于科技动量因子的测试结果表明,在行业中性化后,因子年化IC_IR可达1.18,T值达到2.87,各分位数组别收益率严格单调;相关性方面:该因子与传统的价值、成长、动量反转、分析师情绪以及授权发明专利数因子相关性基本为0;Fama-MacBeth回归测试验证该因子的信息增量十分显著,加入上面提到的5类因子后,综合回归的T值仍然高达3.71。

  3、从逻辑上讲,科技动量因子捕捉的是个股对与其具有潜在科技关联的公司的股价反应不充分、表现相对滞后所带来的机会,而反转则表现了市场对公司信息的过度反应。两者的结合,首先帮我们筛选出了股价可能被错杀的个股(前期大幅下跌,反转效应强),而后再从这其中挑选科技动量强劲的标的。该策略在2013年至2018年的6年里显著跑赢了单一反转策略,效果非常稳定。

  一、专利因子研究回顾

  1.1

  研究背景

  从 1978年改革开放至今,中国经济增长在很大程度上是通过低成本、高素质的劳动力比较优势和资源、环境要素禀赋驱动的,也因而有了传统的三驾马车的发展模式(投资、消费、出口),同时出现了中国制造这样的全球化现象。2008年全球金融危机之后,伴随着内部和外部约束因素的增强,出口、投资这两具引擎对中国经济增长的边际贡献呈现逐年下降的趋势,中国经济的增长开始聚焦于创新驱动的发展战略之上,希望逐渐由“中国制造”过渡到“中国创造”。当前,创新已经成为了中国的国家战略发展方向,相关利好政策不断出台。

  2018年11月5日,国家主席习近平在首届中国国际进口博览会开幕式上宣布设立科创板。科创板是独立于现有主板市场的新设板块,设立科创板并试点注册制是提升服务科技创新企业能力、增强市场包容性、强化市场功能的一项资本市场重大改革举措。

  2019年4月,美国倾国家之力,全面封杀华为,这种逆全球化的手段虽不得人心,但究其原因无外乎在于核心专利技术所映射的大国科技霸权。中国崛起不仅仅需要一个华为,我们要千千万万个华为。幸运的是,我们已经在这条道路上披荆斩棘、不断前行。从2010年开始,国内的专利申请量突破了100万件,同时也成为全球范围内专利申请量最多的国家。

  从上述的一系列事件中我们不难看出,科技创新将是未来一个时期中国经济发展的重要驱动力,也是大国之间竞争的主战场。资本市场,特别是以股票交易为核心的二级市场,本来就是服务实体经济的重要抓手,因此把和创新相关的信息纳入到我们的股票投资分析框架之中,将是未来投资管理人必然的选择。本文正是从反映创新成果的重要维度——专利信息入手,尝试从量化的角度将其融入股票组合的筛选过程之中,增强投资组合的表现。

  1.2

  过往研究回顾

  在专利数据系列研究的第一篇报告《从中国心到中国芯--贸易战引发的专利选股有效性研究》中,我们详细的介绍了专利数据的特征,因子的构建方式,并对专利因子的选股能力进行了全面的测试。这里,我们将从以上三个方面对之前的研究做一个简单的回顾。

  1.2.1专利数据特征

  我们研究所使用的专利数据由深圳德高行知识产权数据技术有限公司提供,德高行是一家专业的知识产权解决方案供应商,其原始数据来自于国家专利局。我们对专利数据的分析主要从专利分类、专利所处状态以及具体指标三个维度展开:

  1. 专利分类:从类别上来看,专利一共有三类:

  a) 发明专利:是指对产品、方法或者其改进所提出的新的技术方案;

  b)实用新型专利:是指对产品的形状、构造或者其结合所提出的适于实用的新的技术方案;

  c)外观设计专利:是指对产品的形状、图案或者其结合以及色彩与形状、图案的结合所作出的富有美感并适于工业应用的新设计。

  2.专利状态:一个专利的获得大致要经历专利申请、专利公开、实质审查、专利授权几个流程(注意新型和外观专利没有实质审查,仅有形式审查)。

  3.具体指标:落脚到对专利具体的描述,目前已有的数据包括:专利数量、说明书总字数、权利要求总项数、独权总项数、附图总数、摘要总字数、IPC分类号总数、寿命加总、专利审查期加总、前引、后引、非专利方面引用、同族专利共计13种类。

  由于我们对专利数据的主要应用场景为A股市场投资策略的开发,因此对数据的行业分布特征是非常关注的。我们以授权发明专利总数为研究对象,分析了专利的行业分布特点。从统计结果来看,不同行业的专利数量有很大的差异,专利较多且数量稳定的行业有10个:家电、电子元器件、汽车、机械、基础化工、通信、电力设备、计算机、医药、建筑,我们称之为专利属性行业。

  1.2.2、选股因子构建

  根据前面提到的专利分类、专利状态和具体指标,在理论上我们可以定义出3*4*13=156个专利因子(专利有3种类型、4种状态,13个具体指标)。例如,我们可以定义公开发明专利数、授权发明专利数或者授权发明专利前引数等因子。但需要注意的是,并不是所有的由排列组合得到的因子都有意义。在实践中,我们一共构建了33个专利类的选股因子用于研究,部分因子的定义参见图表,完整定义参阅专利系列一报告。

  1.2.3、因子选股能力研究

  授权发明类因子整体都呈现出比较稳定的选股能力。以行业市值中性化后的授权发明专利数因子为例,其IC均值达到了0.024,t统计量为6.0,预测能力非常显著。

  相关性测试结果显示,授权发明专利数因子与价值、成长、分析师情绪的相关性仅为0.17、-0.01、0.0035,可见专利因子与传统因子的相关性较低。而FamaMacBeth回归测试结果显示:即便在加入价值、成长、分析师情绪后,专利因子的选股有效性依然非常强,信息增量特征明显。

  应该说,专利系列研究的第一篇报告为我们接下来的工作开了一个好头,同时也引发了我们的一些思考。除了一些简单的特征描述指标,我们还能够从哪些角度对专利数据进行分析呢?本文将尝试从专利分类入手,通过定义科技关联度这一核心概念,进而聚焦于科技动量因子的研究。

  二、科技动量因子构建

  2.1

  专利IPC分类

  《国际专利分类表》(IPC分类)是根据1971年签订的《国际专利分类斯特拉斯堡协定》编制的,是目前国际通用的专利文献分类和检索工具。国际专利分类系统按照技术主题设立类目,把整个技术领域分为5个不同等级:部、大类、小类、大组、小组,分别对应着8、145、670、3,000+、10,000+个类别。某种程度上IPC分类可以理解为一种全新的行业分类(部分概念释义参见图表-7)。从数据来源角度讲,一个专利的IPC分类的原始数据是一个JPG格式的文件,从中进行解析即可得到IPC分类相应的数据,具体参见图表-8。

  我们将所有上市公司过去5年的有效授权发明专利映射到IPC一级分类,并分别统计每个类别包含的数量。从结果来看,不同部之间的差异较大,B、C、G、H四大部占绝对优势;从不同部的变动趋势来看,呈现稳定增加的态势。

  一个专利可以映射到同一个类别下的多个维度(比如如果考察部这个级别,那么一个专利即可以映射到A、也可以映射到B),而这是审查员(专利局)的职权。不同领域、不同时期的审查员的水平可能不一样,IPC的映射质量可能也会有一定的波动。这里,我们观察单个专利映射到二级分类的平均数量。从趋势来看,平均分类数呈现稳定增加的态势。

  2.2

  从科技关联度到科技动量

  一般来说,我们认为同一个行业内的公司,其股价往往也会呈现相似的走势。所以在传统的选股框架下,从宏观配置(宏观经济层面)、中观把控(行业层面),再到微观选择(个股层面),是一套相对成熟且在市场中被无数次验证和使用的方法论。但与此同时我们也发现,现如今的公司业务线非常复杂,很多时候两家公司的主营业务收入来源可能并不一样,但却在产品研发和创新领域有着深层次的关联,而这种关联很有可能在企业未来的发展中扮演越来越重要的角色。如何在传统行业分类方式之外对这种科技领域之间的联系进行有效刻画?这正是接下来我们将要构建的科技关联度指标所擅长的。

  科技关联度的定义离不开专利的IPC分类。前面提及,IPC分类共有5层:部、大类、小类、大组、小组。我们以第二层——大类(共计145个大类)为例来阐述科技关联度的定义如下:  

  Ti,t为公司i在t时刻的IPC二级分类,techij,t公司i和公司j在t时刻的科技关联度值。

  从上述定义公式不难看出,科技关联度本质上表达的是两家公司的专利在类别上的相似程度。指标值越大,代表两个公司在申请的专利类别上布局越相似、创新研发方向也越趋于一致。这种相似性的衡量方式,已经跨域了传统财报以及行业分类所能提供的信息,在一定程度上反映了公司未来的发展战略方向。这里我们通过一个具体的例子体会一下。

  中国石化(600028.SH)与中国化学(601117.SH)两个公司分属于石油石化与建筑这两个不同的行业,在主营业务层面两者的关系并不大。但通过计算,我们发现两者的科技关联度一直维持在一个较高的水平。以两家公司在2018年12月31日的IPC二级分类分布为例,我们发现两家公司在大部分专利类别中都呈现出较高的一致性。

  正因为科技关联度高的公司在业务方向和创新研发上具有更高的相似性,所以我们也有理由推测,其二级市场股价的联动性也将更为显著。有鉴于此,我们利用科技关联度和股票涨跌幅开发了科技动量因子,定义如下式: 

  Retj,t表表公司j在t时刻月度收益率,techij,t表示公司i和公司j在t时刻科技关联度, tech_reti,j代表表公司i在t时刻的科技动量因子。简单来说,我们在每个月底,计算了除目标公司外的其他公司在科技关联度下的加权平均月收益率,而该收益率就是我们所谓的科技动量。

  我们也是在一些观察经验的基础上作出上述推测的,例如前面提到的中国石化(600028.SH)与中国化学(601117.SH)这两只股票,观察两者的股价,我们发现其走势一致性非常强。那么这种规律是否能够在更多的股票以及更长的时段上成立呢?我们将在第三章节中给出详细的测试结果。

  三、科技动量因子有效性验证

  在正式开始对科技动量因子进行测试之前,有几点需要明确:

  1.后续所有的研究时间窗口为2013年1月-2018年12月;

  2.在上一篇专利数据研究报告中,我们发现专利数据具有较强的行业属性,在银行、房地产、非银等金融行业中覆盖度比较低。所以后续的研究中,我们将剔除大金融板块(房地产、银行、非银);

  3.后续的研究是均基于IPC二级分类展开。

  3.1

  科技动量因子测试

  首先我们观察一下因子IC的测试结果。原始因子IC徘徊在0左右,T值仅为0.25。在行业中性化后,科技动量因子的表现得到了系统性提升,T值高达2.87,有效性较强。

  进一步,我们观察该因子的分位数组合测试结果:各组别年化收益率、夏普率严格单调:首组年化收益率高达17.7%,夏普率达到0.53,多空年化收益率达到9.2%,夏普率高达1.76。

  3.2

  科技动量因子特异性分析

  量化选股领域目前面临着选股因子同质化、新因子开发难度加大的窘境。一般情况下,当我们研究一个新的因子,都需要考察该因子与传统因子的共线性、增强等问题,对专利因子的研究同样不例外。为了解决这个问题,我们将首先研究专利因子与传统因子的相关性,并进行FamaMacBeth回归测试。同时为了衡量该因子与传统专利因子的差异性,我们将上一篇专利研究报告(参见文献引用部分)中构建的过往5年授权发明专利数因子也纳入了考察范围之中。

  传统的选股因子包括:价值、成长、分析师情绪、动量反转、质量、另类因子6大类,鉴于质量因子选股作用较弱,另类因子更多的聚焦于价量变动,我们这里仅研究科技动量因子与其他四类因子以及授权发明专利数因子的相关性。

  测试结果表明,科技动量因子与各类因子的相关性非常低,均在0左右。而FamaMacBeth回归测试结果进一步说明,在加入价值、成长、分析师情绪、动量反转以及专利因子后,科技动量因子的选股有效性依然非常稳定,能够提供显著的增量信息。

  四、基于科技动量因子的选股策略研究

  单独使用科技动量因子的表现在上一章节中已经有了比较充分的探讨,本节我们将主要聚焦于将科技动量与反转因子相结合。从逻辑上讲,科技动量因子捕捉的是个股对与其具有潜在科技关联的公司涨跌反应不充分,股价表现相对滞后所带来的机会,而反转则表现了市场对公司信息的过度反应。两者的结合,首先帮我们筛选出了股价可能被错杀的个股(前期大幅下跌,反转效应强),而后再从这其中挑选科技动量强劲的标的。具体的策略设定如下:

  1、股票池

  全市场所有股票,抛除ST、中信一级行业中的大金融板块(房地产、银行、非银)。同时调仓时保证非涨跌停。

  2、时间窗

  2013年1月-2018年12月底

  3、加权方式

  等权/流通市值加权

  4、选股策略

  月度调仓,同时分层筛选:1、每期分行业选择跌幅最大的50%的股票;2、进一步分行业选择科技动量因子最大的20%的股票。

  作为基准策略,我们观察该策略与单独的反转策略进行对比。从测试结果来看,无论是等权亦或是流通市值加权,基于科技动量因子和反转因子结合的策略表现远优于单独反转因子的表现。

  五、总结

  在专利数据专题研究的第二篇报告中,我们从专利IPC分类数据的介绍出发,通过引入科技关联度这一重要概念,构建了科技动量因子。科技动量在与传统因子和之前研究过的普通专利因子保持着很低的相关性的前提下,依旧具有稳定的股票超额收益的预测能力。

  专利是一类比较新颖而复杂的另类数据类型。国外在专利的申请、审核、专利的质量把控方面有着较为完善的体制和丰富的研究成果,而我国在这方面起步相对较晚,目前对相关数据的利用还不是太成熟。未来,我们将继续在专利数据领域精耕细作,努力为大家揭开那些隐藏在深处的规律、特征,以便更好地服务于大家的投资与研究工作。

  风险提示:本报告模型及结论全部基于对历史数据的分析,当市场环境变化时,存在模型失效风险。

  六、参考文献

  [1].Charles M.C. Lee, StephenTengSun,RongfeiWang, and Ran Zhang (2018).Technological Links and Predictable Returns.Journal ofFinancial Economics, Mar 13 2018

  [2].徐寅,郑兆磊 (2018). 从中国心到中国芯--贸易战引发的专利选股有效性研究,兴业证券经济与金融研究院, Dec 202018

  注:文中报告节选自兴业证券经济与金融研究院已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。

  证券研究报告:《基于专利分类的科技动量因子研究》。

  对外发布时间:2019年6月25日

  报告发布机构:兴业证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)

 

新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

免责声明:自媒体综合提供的内容均源自自媒体,版权归原作者所有,转载请联系原作者并获许可。文章观点仅代表作者本人,不代表新浪立场。若内容涉及投资建议,仅供参考勿作为投资依据。投资有风险,入市需谨慎。

责任编辑:陈悠然 SF104

选股 股价

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 07-03 神马电力 603530 --
  • 07-03 杭可科技 688006 --
  • 07-02 睿创微纳 688002 --
  • 07-02 天准科技 688003 --
  • 06-27 华兴源创 688001 24.26
  • 股市直播

    • 图文直播间
    • 视频直播间