【专题报告——基本面量化】基于夜光数据的固定资产投资预测模型

【专题报告——基本面量化】基于夜光数据的固定资产投资预测模型
2020年07月10日 17:00 东证衍生品研究院

本报告通过对固定资产投资与夜光数据的截面回归模型、时间序列滚动回归模型的研究。从截面和时间序列两方面验证了夜光模型在各地区的固定资产投资和房地产开发投资的预测上具有显著的意义。

截面回归模型中,分别选取了2014年4月和2020年4月两个时间截面,样本数据采用31个地区的固定资产投资和房地产开发投资额的当期值。回归结果显示:

1.固定资产投资与夜光强度的拟合度都在0.46附近,房地产投资与夜光强度在2014年的时候在0.73左右,而到了2020年度房地产投资与夜光强度的拟合度高达0.88。从截面回归结果来看,房地产投资与夜光强度是高度相关的。

2.从残差百分比的地区分布来看,欠发达地区像西部地区和东北部分地区的残差百分比较大,东南部发达地区残差百分比较小。通过夜光数据进行截面预测如果进行地区分类,会提高预测准确性。

时间序列滚动回归的样本包括了国内31个地区固定资产投资额和房地产开发投资额的当期值、当期值环比和当期值同比。夜光数据采用了区域发展总指数、区域发展平均指数和地区空间发展率,并对三个指数进行了同比和环比处理与样本指标相对应。回归结果显示:固定资产投资当期差分、固定资产当期环比、房地产投资当期差分和房地产当期环比的胜率都超过了70%,其中一些地区接近了9成胜率。

总体上看,无论是截面回归模型还是时间序列回归模型,夜光数据和固定资产投资,尤其是房地产开发投资有很高的相关性,并可以通过构建相关夜光模型对其进行预测。同时夜光数据发布时间要早于统计局公布的固定资产投资数据,因此通过夜光数据进行固定资产投资等指标的预测具有一定的前瞻性。

报告全文

1

概述

1.1夜光数据介绍

最早的夜光数据是来源于美国国防气象卫星计划(DMSP),是由美国空军运营并由美国国家海洋和大气管理局(NOAA)保存。该计划的第一颗卫星是在1972年6月发射,在1992年形成图像并常态化记录在NOAA下。从1992年到现在,已经有一系列的DMSP下的卫星进行夜光数据图像的采集。除了DMSP系统下的夜光数据以外,2012年有了新一代的夜光数据卫星采集系统,是由Suomi国家极地轨道合作伙伴(NPP)卫星获得的可见红外成像辐射计套件(VIIRS)夜光图像。本研究专题采用的的卫星夜光数据就是来源于此。NPP- VIIRS最初为监测大气和环境变化而设计的卫星系统,其夜光数据是大气无云条件下的副产品。与DMSP夜光数据相比,VIIRS-NPP在卫星上装载了辐射校准设备,大幅提高了辐射的检测能力和检测精度,同时在一定程度上解决了城市中心的夜光过饱和现象。Li和Xu等(2013)在对比了NPP-VIIRS和DMSP-OLS夜光数据对经济指标的预测效果后,得出NPP-VIIRS在经济指标的预测上要显著强于DMSP-OLS。

1.2夜光数据应用

无论是DMSP-OLS卫星数据还是NPP-VIIRS卫星数据,其应用场景主要观测一系列微弱排放源的主要来源,例如城市照明,船队,工业场所和大火等,通过观测不同强度的灯光,以此来追溯人类活动的行为轨迹,在人类活动监测研究中发挥重要的数据源作用。因此,近些年夜光数据也成为国内外研究学者在研究人类行为活动中的重要数据来源和手段。从现有的夜光数据研究类别来看,主要分为自然科学研究和社会科学研究,其中自然科学研究主要集中于城市化方面的研究,其中包括城市空间扩展,人口估算,城市群演化、城市污染研究等等。社会科学方面主要集中在经济发展研究,电力能源消耗研究以及政治与经济增长研究等。

夜光数据可以用于表示某区域夜间灯光强度,是表征某一区域的经济发展水平的较理想的指数,因此在一定条件下可以作为研究. 这一领域的研究文献较多,如基于夜间灯光数据的中国省域GDP总量分析,基于夜间灯光数据的连片特困区GDP估算及其空间化。,基于夜间灯光数据的珠三角地区震级GDP估算等等。这些研究结果均得出灯光强度和GDP具有紧密联系。以此可以看出,一个地区的夜光强度与其经济成长是高度相关的。

1.3固定资产投资与夜光

固定资产投资通常是衡量一个国家或者地区一年内的固定资产方面投资总量的指标。固定资产投资与其他手段相比,对经济增长的拉动作用比较直接和显著,通常是政府实现经济增长目标和进行宏观调控的首要手段。其中宋(2011)对1980-2010年我国的固定资产投资和我国经济增速进行了检验,得出从宏观层面上支持固定资产投资是我国经济增长的促进因素之一,同时,快速的经济增长也反向带动了固定资产投资的增长。而从夜光角度来看,夜光的增长是GDP增长的直观体现,这在一些文献中已经被广泛的证明的了。从国内的GDP结构上来看,出口、消费和投资是经济增长主要的“三驾马车”。从夜光的特点来看,夜光能够在某种程度上反映出消费和投资的一些情况。夜光经常被用于城市化相关方面的研究,而城市化进程离不开固定资产投资,尤其是房地产开发投资。因此在我们研究中,我们将会深入的研究如何将夜光数据应用于固定资产投资和房地产投资的预测。

2

研究范围和研究方法

2.1 研究范围

我们选取了全国31个省份作为样本研究数据,指标选择了31个省份的固定资产投资(IFA)和房地产开发投资(REDI)。夜光数据指标我们采用了三类不同的指标,分别是代表亮光发光总量的区域发展总指数,代表发光亮度平均值的区域平均发展指数以及代表着发光区域变化的地区空间发展率。夜光指标具体计算方法如下:

区域发展总指数是指定区域内的所有发光区域内发光像元N的亮度值r相加得到的总和值D,代表整个区域的整体的夜光亮度值。

区域平均发展指数是指定区域内所有发光区域的发光像元的亮度值相加得到的总和值(即区域发展总指数)和与该区域内发光像元个数相加得到的总和数的比值,代表该区域发光地区的平均夜光亮度值

地区空间发展率指定区域内的发光像元的总和数N与该区域内所有夜光像元总和数的(发光像元数和不发光像元数M)比值,近似城镇化率 D

2.2 研究方法

数据清洗

本研究采用的数据为统计局公布的各省固定资产投资/房地产投资累计值同比。因为各省固定资产投资和房地产投资累计值数据于2017年以后停止公布,所以需要通过累计值同比数据进行数据清洗,得到固定资产投资/房地产投资当期值。并利用当期值与夜光数据进行匹配。

截面数据回归分析

横截面数据是指在某一时点收集的不同对象的数据它对应同一时点上不同空间(对象)所组成的一维数据集合,研究的是某一时点上的某种经济现象,突出空间(对象)的差异。本文主要研究的是在同一年(月),中国不同省份的固定资产投资/房地产投资与夜光数据的关系。

相关性分析:

相关系数最早是由统计学家皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。公式如下:

其中Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。

r(X,Y)的取值范围是-1到1,其中当r=1时为强正相关性,当r=-1 时是强负相关性。而当r=0时是弱相关性。

平稳性检验

通常所说的随机过程的平稳性概念有弱平稳和严平稳两种,时间序列分析中通常所指的平稳随机过程就是弱平稳随机过程。金融时间序列一般呈现明显的时间趋势,在检验时间趋势之前,需要确定在时间序列中是否存在单位根。在单位根假设被拒绝后,才可以确定数据是由带趋势的稳定过程产生的。 

David Dickey 和 Wayne Fuller的单位根检验即迪基——富勒(DF)检验是在对数据进性平稳性检验中比较常用到的一种方法。本研究采用的是增广的DF检验即ADF检验,模型如下:

其中t是时间或趋势变量,此时的零假设为:。如果拒绝零假设,则原时间序列没有单位根,此时原序列是平稳的,如果不能拒绝零假设,则原序列有单位根,序列不平稳。

当我们对序列检验发现不平稳的情况下,为了防止伪回归的发生,我们通常选择对指标序列进性差分处理,对于一般金融数据一阶差分后,即由总量数据变为增长率,一般会平稳。

时间序列滚动回归

线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。

回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。其表达形式为 ,e为误差,服从均值为0的正态分布。

其中在做线性回归分析之前,我们针对时间序列指标进行了平稳性检验。对非平稳的时间序列进行回归将会导致伪回归的发生,对指标选取产生错误信号。

滚动回归是指通过对新一期的数据进行学习之后,对下一期的数据进行回归的一种回归方法。具体方法步骤如下:

首先将新一期的数据加入到数据序列中。

重新生成一元回归模型以及参数

通过新生成的模型预测下一期数值

3

研究结果

3.1截面数据回归分析

截面数据主要选择了两个时间点,分别是2014年4月份和2020年4月份。空间数据选取了中国31个省份。从下图可以看到,在2014年我国整体的夜光数据呈现的是东强西弱,尤其是东部沿海地区的夜光较强。而从全国的固定资产投资的地图上,可以看到整体的固定资产投资数据也显现出东西弱,同样大量的固定资产投资也集中在东部沿海一带。从可视化地图上可以看出,固定资产投资的强弱与夜光强度的强弱有高度的相关性。从房地产投资上来看,东南中南强西北东北弱表现的更明显。从2020年的夜光地图来看,中国各地区的夜光情况与2014年的夜光情况差别不大,中南部略有增强。从固定资产投资上也能看出中南部地区整体投资有所增强。由此可见,通过地图形式可以直观的感受到夜光指数与经济指标有一定的相关性,后续研究将从数量上说明夜光数据在截面上与固定资产投资和房地产开发投资的相关性。

将固定资产投资额当期值/房地产开发投资额当期值与夜光总强度做OLS回归分析,可以看到无论是2014年4月还是2020年4月,房地产投资与夜光强度回归之后的拟合度要远好于固定资产投资和夜光强度回归之后的拟合度。从2014年和2020年两个时间段来看,固定资产投资与夜光强度的拟合度都在0.46附近变化不明显,房地产投资与夜光强度在2014年的时候在0.73左右,而到了2020年度房地产投资与夜光强度的拟合度高达0.88。可见房地产投资与夜光强度是高度相关的。

从2014年房地产开发投资的回归结果来看,残差百分比最小的是江苏,预测值与实际值相差最小。从地区分布来看,欠发达地区像西部地区和东北部分地区的残差百分比较大。原因主要是房地产开发投资额相对较小而地域较大导致夜光总强度与房地产开发投资的额度不符。因此从对残差的分析结果来看,如果进行截面形式的回归预测,要进行地区分类,例如根据城市化程度,或者经济发达程度进行分类,之后进行预测,预测结果会比较接近于实际值。

根据截面回归分析的结果来看,总体上房地产开发投资与夜光总强度的拟合度要远大于固定资产投资与夜光总强度的拟合度。从固定资产投资的结构来看,除了建筑本身的固定资产投资以外,还包括机器运输工具等的购买以及一些企业的更新改造和修理。其中有很大一部分很难直接反应在夜光总强度的改变上。而房地产开发投资是该地区在建筑上直接投资,从理论上看,房地产投资的变化对夜光的变化有明显的影响。从截面回归分析的结果来看,也认证了这一点。从此之外,我们从截面回归的残差分析中得出一个比较有意义的结论,利用夜光进行截面的经济指标预测的时候,根据不同地区经济情况进行分类预测,预测准确率会相对较高。

3.2时间序列回归分析

3.2.1相关性分析

首先我们对国内31个省市的固定资产投资当期值和房地产投资当期值与区域发展总指数、区域发展平均指数和地区空间发展率分别进行相关性分析。相关性区间为2014年1月份到2020年4月份。具体相关系数图如下:

从相关性结果来看,区域发展总指数和地区空间发展率与固定资产投资和房地产开发投资的相关性要好于区域发展平均指数与两个目标经济指标的相关性。从不同地区的相关性结果来看,在固定资产投资与区域发展总指数相关性上,相关性达到弱相关(相关系数大于0.3)以上的有21个地区,强相关的地区(相关系数大于0.6)有7个。房地产开发投资与区域发展总指数的相关性结果显示,相关性达到弱相关以上的有20个,强相关的地区有6个。

理论上讲,房地产投资和固定资产投资会拉动地方经济,因此房地产开发投资和固定资产投资应该与夜光数据成正相关的关系。但从相关性结果来看,有一些有趣的结论。房地产投资和固定资产投资在东北地区辽宁、黑龙江、内蒙和吉林地区与夜光数据是呈负相关的。也就是说在2014年到2020年期间,随着在东北地区的固定资产投入的越多,夜光越差。从截面回归分析中我们也看到,东北地区的数据明显都大幅偏离全国回归的预测值。从实际情况分析来看,东北地区是我国最早城市化的地区,城市化程度较高,而夜光是城市化度量重要指标。由于城市化相对饱和,因此夜光变化随着房地产投资和固定资产投资的变化不会太大,这种情况我们可以从上海,北京和天津这些直辖市的相关性上可以得到佐证。除此之外,东北经济最近几年受制于人口流失、缺少新的经济增长点和老的工业制造业如何转型的困扰,显然固定资产投资和房地产投资对其并没有很大的效果。

相关性比较高的城市主要都是集中在东南部沿海地区,经济活力较高的地区。房地产开发投资和固定资产投资对这些地区的夜光影响较大。说明这些地区处于一个城市化和经济高速发展的阶段。

3.2.2时间序列回归之平稳性检测

为了进行时间序列的回归预测,首先要进行平稳性检测,确保模型不出现伪回归的现象。

从当期值的平稳性看,绝大部分地区的固定资产投资和房地产开发投资p值都大于0.05,无法满足时间序列平稳的条件,因此当期值需要做差分处理进一步进行平稳性检验。

从当期值同比的平稳性分析来看,大部分地区的指标满足平稳性条件,其中仅有少数省份无法满足,其中固定资产投资中安徽、江西、河南、湖北、湖南、重庆、贵州、云南、陕西和宁夏都是不平稳序列。房地产投资中北京、河北、江苏、浙江,河南、海南、四川、云南和宁夏等都是不平稳序列。

从当期值环比的平稳性分析来看,与同比相差不大,其中三个夜光指数的环比平稳性都能满足要求。固定资产中的平稳性表现要相对较差,需要进行一些差分处理。再检查一下平稳性指标。以能够符合时间序列预测的要求。

3.2.3时间序列回归之差分

根据当期值,当期值同比和当期值环比的平稳性检测结果,检测一阶差分之后的平稳性情况。没有达到平稳的各地区的固定资产投资和房地产开发投资进行了差分处理并与未差分之前做了比较。

从差分结果来看,差分之后的当期值,当期值同比和当期值环比基本都满足平稳性的条件。尤其是当期值差分之后的平稳性更能满足平稳性要求。当期值差分之后也具有一定的经济学意义,表示的是增长值,也可以用来进行预测。同比环比虽然差分之后有一些指标效果变好,但差分之后的同比环比值本身经济学意义不大,因此还沿用原值进行回归预测。

3.2.4时间序列回归之滚动OLS

根据平稳性结果,利用夜光数据分别对固定资产投资当期差分、固定资产投资当期环比、固定资产投资当期同比、房地产投资当期差分、房地产投资当期环比和房地产投资当期同比与区域发展总指数进行滚动OLS回归预测。其中胜率判断的依据是预测值的方向是否与实际值的方向一致。

从滚动回归预测的结果来看, 固定资产投资当期差分、固定资产当期环比、房地产投资当期差分和房地产当期环比的胜率都超过了70%,其中一些地区接近了9成胜率。固定资产投资和房地产投资同比胜率相对较低,但也达到平均6成左右。从目前的胜率来看,基本可以判断出各地区固定资产投资和房地产投资的增长趋势。

综合来看,夜光模型在对各地区的固定资产投资和房地产开发投资的预测上具有显著的经济学意义。而准确的预测固定资产投资和房地产开发投资对于大宗商品需求的预测具有比较明显的作用。而我们国家统计局公布的固定资产投资和房地产开发投资的数据比较滞后半个月到20天左右。繁微平台的夜光数据为每月月底准时公布,因此可以提前通过夜光数据和宏观指标的模型进行宏观指标的趋势性预测,可以在大宗商品基本面判断上领先一步。

4

总结

本报告通过对固定资产投资与夜光数据的截面回归模型、时间序列滚动回归模型的研究。从截面和时间序列两方面验证了夜光模型在对各地区的固定资产投资和房地产开发投资的预测上具有显著的经济学意义。

截面回归模型中,分别选取了2014年4月和2020年4月两个时间截面,样本数据采用31个地区的固定资产投资和房地产开发投资额的当期值。回归结果显示:

1.固定资产投资与夜光强度的拟合度都在0.46附近,房地产投资与夜光强度在2014年的时候在0.73左右,而到了2020年度房地产投资与夜光强度的拟合度高达0.88。从截面回归结果来看,房地产投资与夜光强度是高度相关的。

2.从残差百分比的地区分布来看,欠发达地区像西部地区和东北部分地区的残差百分比较大,东南部发达地区残差百分比较小。通过夜光数据进行截面预测如果进行地区分类,会提高预测准确性。

时间序列滚动回归的样本包括了国内31个地区固定资产投资额和房地产开发投资额的当期值、当期值环比和当期值同比。夜光值数采用了区域发展总指数、区域发展平均指数和地区空间发展率,并对三个指数进行了同比和环比处理与样本指标相对应。回归结果显示:固定资产投资当期差分、固定资产当期环比、房地产投资当期差分和房地产当期环比的胜率都超过了70%,其中一些地区接近了9成胜率。固定资产投资和房地产投资同比胜率相对较低,平均但也达到6成左右。从目前的胜率来看,基本可以判断出各地区固定资产投资和房地产投资的增长趋势。

总体上看,无论是截面回归模型还是时间序列回归模型,夜光数据和固定资产投资,尤其是房地产开发投资有很高的相关性,并可以通过构建相关夜光模型对其进行预测。同时夜光数据发布时间要早于统计局公布的固定资产投资数据,因此通过夜光数据进行固定资产投资等指标的预测具有一定的前瞻性。

参考文献:

[1] Li X, Xu H, Chen X, et al. Potential of NPP-VIIRS nighttime light imagery for modeling the regional economy of China[J]. Remote Sensing, 2013, 5(6): 3057-3081.

[2] 宋丽智. 我国固定资产投资与经济增长关系再检验: 1980-2010 年[J]. 宏观经济研究, 2011 (11): 17-21.

[3] Sutton P C, Elvidge C D, Ghosh T. Estimation of gross domestic product at sub-national scales using nighttime satellite imagery[J]. International Journal of Ecological Economics & Statistics, 2007, 8(S07): 5-21.

[4] 张锋. 夜光遥感数据应用研究综述[J]. 建设科技, 2017 (14): 50-52.

报告作者

章顺  资深分析师(基本面量化)

海量资讯、精准解读,尽在新浪财经APP
卫星 经济增长 房地产投资 GDP

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 07-13 芯朋微 688508 28.3
  • 07-13 大地熊 688077 28.07
  • 07-13 德林海 688069 67.2
  • 07-13 三生国健 688336 28.18
  • 07-13 申昊科技 300853 30.41
  • 股市直播

    • 图文直播间
    • 视频直播间