深度推荐 | 金工:人工智能44:深度卷积GAN实证

深度推荐 | 金工:人工智能44:深度卷积GAN实证
2021年04月15日 07:36 新浪财经-自媒体综合

基金红人节|金麒麟基金大V评选 百位大咖入围→【投票

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

来源:华泰证券研究所

摘要

核心观点

W-DCGAN模型可用于多资产金融时间序列生成,效果良好

本文探讨GAN的重要变式——DCGAN(深度卷积生成对抗网络)在生成多资产金融时间序列中的应用。原始GAN模型存在固有缺陷,DCGAN和WGAN分别从网络结构和损失函数的角度提出改进,将两种改进方案融合可得到W-DCGAN模型。测试各模型对多资产金融时间序列的生成效果,并采用9项单资产序列指标和5项多资产序列指标评价生成质量。结果表明DCGAN表现不理想,结合W距离损失函数的W-DCGAN效果好且略优于WGAN,W-DCGAN能较好地复现出真实序列的各项典型化事实。

DCGAN的核心思想是针对网络结构改进原始GAN

和WGAN针对损失函数改进的思路不同,DCGAN的核心思想是针对网络结构改进原始GAN。DCGAN使用更灵活的转置卷积层和带步长的卷积层,分别替代GAN模型中的上采样层和池化层。同时,DCGAN取消全连接层,并调整归一化层、激活函数、优化器等网络组件,使生成器和判别器均为全卷积网络结构。

W-DCGAN融合DCGAN的网络结构与WGAN的损失函数

尽管在网络结构上更为合理,DCGAN并没有解决GAN模型的根本缺陷,并且仍需要小心设计训练过程及网络参数,调参难度较大,单纯使用DCGAN模型在实践中效果并不理想。本文对DCGAN模型做进一步改进,借鉴WGAN模型思想,将W距离应用于DCGAN的损失函数中,构建W-DCGAN模型。W-DCGAN不仅拥有DCGAN的原本优势,还由于W距离的使用避免了梯度消失和模式崩溃现象。

实证结果表明DCGAN效果不佳,W-DCGAN相比WGAN略胜一筹

我们测试各类生成模型在多资产金融时间序列(标普500、上证综指、欧洲斯托克50)生成任务中的表现,并采用前期研究构建的9项单资产序列指标和5项多资产序列指标评价生成质量。结果表明,DCGAN在自相关性、杠杆效应、盈亏不对称性、多资产交叉相关性等指标上生成效果不佳,W-DCGAN和WGAN均表现较好;W-DCGAN总体而言略胜一筹,在盈亏不对称性、Hurst指数、多资产滚动相关系数等指标上有显著优势。总的来看,W-DCGAN模型能较好地复现出真实序列的各项典型化事实。

风险提示:DCGAN和W-DCGAN生成虚假序列是对市场规律的探索,不构成任何投资建议。深度学习模型存在过拟合的可能。深度学习模型是对历史规律的总结,如果市场规律发生变化,模型存在失效的可能。

研究背景

华泰金工生成对抗网络系列研究尝试将生成对抗网络GAN技术运用于量化投资研究。我们测试GAN、WGAN、RGAN等模型生成单个资产收益率的仿真时间序列。结果表明,生成对抗网络能够刻画单个资产真实收益率序列所具备的统计特性,如厚尾分布、波动率聚集等,其中WGAN模型生成效果相对更佳。

由于实际投资研究可能涉及到多个资产,为拓宽应用场景,我们将WGAN模型进行改进,使其同时生成多个资产收益率的仿真时间序列,并构建交叉相关性、波动率相关性等用于评价多资产序列两两之间典型化事实的指标。结果表明,WGAN模型能够胜任生成多资产收益率序列的任务。

作为GAN的一种经典变式,WGAN(Wasserstein GAN)将原始GAN中的JS散度替换成Wasserstein距离(简称 W 距离),用判别器估计生成分布与真实分布的W距离,用生成器拉近W距离,以达到生成样本逼近真实样本的目标。换言之,WGAN相对于原始GAN的改进主要在损失函数部分,而基本没有改变GAN的网络结构。

作为GAN的另一经典变式,DCGAN(Deep Convolutional GAN,深度卷积生成对抗网络)相对于原始GAN的改进主要在网络结构部分。DCGAN是引入CNN的GAN:生成器中使用转置卷积层代替上采样层,判别器中使用带步长的卷积层代替池化层同时去掉全连接层,构成全卷积网络。DCGAN在生成多资产收益率序列任务中表现如何?DCGAN能否与WGAN“双剑合璧”,使用DCGAN的网络结构以及WGAN的损失函数,从而达到更好的生成效果?

本文首先介绍DCGAN的原理及算法,包括卷积与转置卷积、网络结构的设计规则、可能存在的问题等。在DCGAN模型判别器卷积层中,使用多通道处理多资产序列的输入,以适应生成多资产收益率的应用场景。随后简要回顾WGAN的基本思想以及优化目标函数,使其代替原本DCGAN模型中的二进制交叉熵损失函数,得到W-DCGAN模型。采用前期研究《人工智能35:WGAN应用于金融时间序列生成》(20200828)和《人工智能38:WGAN生成:从单资产到多资产》(20201124)中的9个单资产序列评价指标和5个多资产序列评价指标及其反映的典型化事实,以衡量模型的生成效果。

实证测试环节,我们分别测试DCGAN、WGAN和W-DCGAN模型对相同类型资产组合(标普500指数、上证综指、欧洲斯托克50指数)的生成效果。结果表明,单纯使用DCGAN模型进行生成效果并不理想, W-DCGAN模型生成的多资产收益率序列很好地复现了真实序列蕴含的典型化事实,并且生成效果整体优于WGAN模型。

DCGAN原理

卷积神经网络CNN相关概念

CNN是一种常见的深度学习网络架构,受生物自然视觉认知机制启发而来,最初由Yann Lecun等人于1998年提出。CNN的本质是一个多层感知机,可以自动从数据中学习特征,并把结果向同类型位置数据泛化。CNN采用局部连接和权值共享方式,既减少了权值数量使参数易于优化,又降低了模型复杂度减小过拟合风险。

随着数据量的增大和算力的增强,CNN在很多领域取得成功,如图像识别、图像分割等。基础的CNN由卷积、激活、池化三种结构组成,当处理分类任务时,还需要引入全连接层完成从CNN输出特征到标签集的映射。华泰金工《人工智能15:人工智能选股之卷积神经网络》(20190213)已阐释了CNN将高维数据映射到低维特征的机制。下面我们就DCGAN网络结构中涉及到的重点结构予以介绍和说明。

特征学习:卷积与转置卷积

在DCGAN网络结构中,生成器使用转置卷积完成低维特征向高维特征的映射即上采样,判别器使用卷积完成高维特征向低维特征的映射即下采样,因此充分理解卷积和转置卷积的操作机制是重要且必要的。尽管从字面意思上来看,转置卷积操作与卷积操作相反,但事实上并非严格相反,且转置卷积的过程理解起来更晦涩。对此,本文引入仿射变换的形式,以一维卷积和转置卷积操作为例,对比两者的机制异同。

引入非线性:激活函数

在卷积操作之后,通常引入偏置和非线性激活函数,给网络结构引入非线性因素,使得神经网络可以任意逼近任何非线性函数。假设经过卷积操作后有 个神经元 ,对应 个权重 ,若定义偏置为 ,激活函数为 ,则激活操作可以表示为:

可以看出,DCGAN中广泛使用的LeakyReLU(0.2)函数既不会导致梯度消失的问题,同时由于导数不为0,也可以减少静默神经元的出现。

下采样:池化或带步长的卷积

池化是对信息进行抽象的过程,是一种下采样操作。在保持特征的某种不变性(旋转、平移、伸缩等)的前提下,压缩特征图大小、减少参数量、降低优化难度,尽量去除冗余信息保留关键信息,从而达到简化网络复杂度的目的。

此前我们使用的GAN包含2*2的最大值池化层。然而,这种暴力降低特征图分辨率的方法可能丢失大量信息,一个2*2的最大池化操作就会丢失近3/4的信息。在算力足够的情况下,可使用带步长的卷积操作替代池化进行下采样。

映射至输出尺寸:全连接或卷积

全连接层一般会放在网络最后,用以综合所有信息进行降维。例如,此前我们使用的GAN判别器的最后三层结构为全连接,将最终特征图映射到1个神经元作为输出。然而,全连接层参数量较大,容易过拟合,对于空间信息损失较多(因为需要“展平”)。在卷积操作中若卷积核感受野覆盖全图,其计算过程与全连接等效,故可以进行替代。

深度卷积生成对抗网络DCGAN

DCGAN基本原理

Radford等(2016)将CNN与GAN有效结合,充分利用卷积操作强大的特征提取能力来提高学习效果,提出DCGAN结构。DCGAN的基本原理与GAN一致,只是将生成器和判别器换成了全卷积网络。

值得注意的是,作者使用全卷积网络的目的之一是希望可视化网络结构,观察中间层神经元输出结果,从而更好地理解训练过程。然而全卷积网络中的转置卷积操作可能会带来“棋盘效应”。Odena等人(2016)详细论证了转置卷积与“棋盘效应”,并给出了减轻“棋盘效应”的上采样方法:其一是确保转置卷积核大小可以被步长整除,即本文使用的方式,但作者同时表示此方法在实践中并不能完全消除“棋盘效应”;其二是使用最近邻插值或双线性插值法缩放图像再进行常规卷积,即GAN与前期研究中的WGAN使用的方式。因此,转置卷积层的使用可能带来效果下降的风险。

DCGAN网络构建

为了尽量避免生成器G或判别器D任何一方过于强大,D和G在参数数量和网络复杂度方面应当接近平衡。同时,使用转置卷积层时,应尽量设置核尺寸可被步长整除以减轻棋盘效应。

生成器G网络使用含五个转置卷积层的全卷积网络结构。在多资产生成的应用场景下,我们需要通过参数设定保证最后一层转置层的输出为资产数目K乘以序列长度T的形式。G网络具体参数详见下表。

特别地,DCGAN的经典应用场景为图像生成,我们关注的应用场景为金融资产收益率生成,考虑到两者的差异,我们将生成器G网络的输出层神经元激活函数从Tanh改为不激活。实证表明,如果输出层采用Tanh激活函数,得到的资产收益率更接近正态分布,从而失去真实资产收益率的厚尾特性;输出层不激活得到的资产收益率服从厚尾分布。

判别器D网络使用含五个卷积层的全卷积网络结构。在多资产生成的应用场景下,为了使D具有鉴别多资产序列的能力,我们将第一层卷积层设置为多通道输入,每一通道对应多资产序列中的一个标的资产。D网络具体参数详见下表。

DCGAN训练算法

在DCGAN的实际训练过程中,判别器D与生成器G交替进行训练,判别器D训练1次,生成器G训练1次。DCGAN训练算法的伪代码如下所示。

W-DCGAN原理

GAN、DCGAN与WGAN的优势及不足

GAN模型理论上能够利用生成器和判别器之间的博弈不断提升生成能力,但实际存在一些固有缺陷使其训练过程不稳定、生成效果不理想。因此,越来越多的变体被提出用于改善原始GAN模型的训练过程和生成效果。

GAN的缺点回顾

前期研究《人工智能35:WGAN应用于金融时间序列生成》(20200828)已详细讨论了GAN模型的缺点,主要概括为以下三方面:

1.     生成器G和判别器D训练不同步问题。生成器与判别器的训练进度需要小心匹配,若 

匹配不当,导致判别器D训练不好,则生成器G难以提升;若判别器D训练得太好, 则生成器G训练容易梯度消失,难以训练。 

2.     训练不收敛问题。生成器G与判别器D相互博弈,此消彼长,训练过程中任何一方的损失函数都不会出现明显的收敛过程,我们只能通过观察生成样本的的好坏判断训练是否充分,缺少辅助指示训练进程的指标。 

3.     模式崩溃(Mode Collapse)问题。GAN模型的生成样本容易过于单一,缺乏多样性。注意样本单一并不一定导致样本失真:GAN生成的收益率序列表现出的经验特征与真实序列十分接近,但并不代表生成序列包含市场可能出现的各种情况。 

GAN在网络结构上的改进:DCGAN

DCGAN模型对GAN模型的改进集中在网络结构部分,即将生成器G和判别器D设计成全卷积网络,由此带来的优点包括:

1.     由于是全卷积网络,可以观察其中任意步骤的特征图来直观感受训练过程,即增强了可解释性。

2.     通过使用批归一化层将特征层输出归一化到一起,通过使用LeakyRelu激活函数防止梯度稀疏,进而在一定程度上稳定了训练。

3.     通过使用卷积和转置卷积操作,允许了网络学习自己的空间下采样/上采样,更好地提取了特征。

DCGAN模型虽然有了更合理的网络结构,但仍存在一些缺点:

1.     DCGAN的损失函数交叉熵仍无法衡量不相交分布间的距离。

2.     在训练过程中如果判别器训练得太好,能够很好地分辨真假序列,分布不相交的情况会经常出现,若无法较好的分辨其距离就会阻碍生成器的训练。

3.     由于损失函数的不收敛以及对网络参数、结构及训练过程的要求较为严苛,DCGAN网络设计及调参难度较大。

对比DCGAN与GAN模型的缺点,不难发现DCGAN针对网络结构上的改进并没有实质上解决GAN模型的固有缺陷,在稳定训练方面“治标不治本”。因此,想要“根治”这个“顽疾”,就需要找到能够衡量不相交分布间距离远近,并且能够收敛性更好的损失函数。

GAN在损失函数上的改进:WGAN

Arjovsky等(2017)使用Wasserstein 距离(简称W距离)替代GAN所使用的JS散度,这样构建的生成对抗网络称为WGAN。W 距离的原始数学定义在实践中难以直接计算,可通过Kantorovich-Rubinstein Duality公式(Arjovsky,2017)将其等价变换为下式:

前期研究《人工智能35:WGAN应用于金融时间序列生成》(20200828)和《人工智能38:WGAN生成:从单资产到多资产》(20201124)已详细介绍WGAN的基本思想和实现细节,同时以Bootstrap重采样和GARCH模型等传统时间序列生成方法为对照组,充分验证了WGAN在生成单资产和多资产序列方面相对于传统方法的优势。

DCGAN和WGAN的结合:W-DCGAN

DCGAN和WGAN分别从网络结构和损失函数的角度改进原始GAN模型,如果将DCGAN的全卷积网络结构和WGAN带梯度惩罚的W距离损失结合,得到的W-DCGAN或有可能进一步提升生成效果。

W-DCGAN网络构建

W-DCGAN网络结构的构建思路与前文所述DCGAN模型相似,区别主要在于损失函数的计算上。W-DCGAN采用WGAN的损失函数,并且输出层神经元不采用激活函数。

W-DCGAN训练算法

在W-DCGAN的实际训练过程中,判别器D与生成器G交替进行训练,判别器D训练k次(本文取k=5),生成器G训练1次。W-DCGAN训练算法的伪代码如下所示。

生成序列评价指标

单资产收益率序列的评价指标

Cont在2001年发表的综述文章Empirical properties of asset returns: stylized facts and statistical issues从厚尾分布、盈亏不对称性、波动率聚集等11个角度,Chakraborti等人在2011年发表综述文章Econophysics review: I. Empirical facts从价格、收益率、成交量、波动率等角度,分别构建了单资产序列的评价指标。

本文沿用前期研究《人工智能35:WGAN应用于金融时间序列生成》(20200828)构建的自相关性、厚尾分布、波动率聚集、杠杆效应、粗细波动率相关、盈亏不对称性、方差比率检验、长时程相关性、序列相似性9项指标,对生成的多资产收益率序列中的每个单资产收益率序列进行评价。各指标的具体计算过程本文不再赘述。下表简要概括9项指标的计算方法,及对应真实序列的典型化事实和评价结果。

多资产收益率序列的评价指标

学术文献较少提及多资产收益率序列的典型化事实与评价指标。本文沿用前期研究《人工智能38:WGAN生成:从单资产到多资产》(20201124)构建的交叉相关性、波动率相关性、交叉杠杆效应、滚动相关系数分布相似度、极端值相关性5项指标,对生成的多资产收益率序列的不同资产间协变关系进行评价。各指标的具体计算过程本文不再赘述。下表简要概括5项指标的计算方法,及对应真实序列的典型化事实和评价结果。

实证测试结果与讨论

下面以标普500、上证综指、欧洲斯托克50三种资产构成的多资产收益率时间序列为例,展示DCGAN与W-DCGAN的生成效果,并与WGAN进行对比,使用前文介绍的单资产和多资产序列评价指标评价生成序列的质量。具体训练样本及模型通用参数如下两表所示。

真实序列与生成序列展示

本节分别展示真实多资产序列、DCGAN生成序列、W-DCGAN生成序列、WGAN生成序列共四类序列。对于每一类序列,分别展示随机抽取的两组样本。抽取的样本原始数据为对数收益率序列rt。展示时,将其转换为初始价格为1的归一化价格序列。记第0天资产价格为1,则第t天的资产价格如下式所示。

真实序列展示

从训练数据中抽取两组长度为252的真实收益率序列样本,并将其转换为初始价格为1的归一化价格序列,如下面两张图表所示。观察可知,三种资产真实序列可能存在一定短期相关性,其中标普500与欧洲斯托克50正相关性相对更强,两者与上证综指的正相关性相对弱。

DCGAN损失函数与生成序列展示

首先考察DCGAN生成器G和判别器D损失函数值的变化情况,如下图所示。结果显示,G和D的损失函数值都存在一定程度的波动,但G和D分别在迭代1000和2000次(训练一个Batch为一次迭代)之后基本保持在相对稳定的水平上。

下面两张图展示DCGAN随机生成的两组样本,生成的多资产收益率序列已转化为归一化价格序列。直观上看,标普500和欧洲斯托克50存在强的正相关性,两者和上证综指存在相对弱的正相关性,该现象与真实序列一致。

W-DCGAN损失函数与生成序列展示

其次考察W-DCGAN生成器G和判别器D损失函数值的变化情况,如下图所示。结果显示, G和D的损失函数值在2500次迭代后基本保持在相对稳定的水平上。

下面两张图展示W-DCGAN随机生成的两组样本,生成的多资产收益率序列已转化为归一化价格序列。同样能观察到标普500和欧洲斯托克50存在强的正相关性,两者和上证综指存在相对弱的正相关性。

WGAN生成序列展示

下面两张图展示WGAN随机生成的两组样本,生成的多资产收益率序列已转化为归一化价格序列。WGAN对于多资产收益率序列的生成效果已在前期研究《人工智能38:WGAN生成:从单资产到多资产》中进行了详细论证,在此不再赘述。需要指出的是,使用W距离作为损失函数的W-DCGAN和WGAN模型都存在训练时间较长、收敛速度较慢的缺点。

评价指标对比

仅从上节展示的价格序列看,很难直观判断生成序列的质量,需结合量化指标对生成序列进行更为细致的评价。下面我们分别从单资产序列和多资产序列两个角度评价和对比生成序列的质量。

单资产序列评价指标

分别计算标普500指数、上证综指、欧洲斯托克50指数的真实序列和生成序列的单资产序列评价指标。本文以上证综指的9项单资产序列评价指标计算结果为例,分别对真实序列、DCGAN生成序列、W-DCGAN生成序列、WGAN生成序列进行比较分析。

以上证综指为例,真实序列的前6项单资产序列评价指标如下图所示。我们依次对真实序列的前6项评价指标进行分析,并从中提取真实序列的典型化事实:

1.      自相关性:左上子图为收益率k=1~120阶时滞自相关系数,各阶时滞自相关系数接近0,表明真实收益率序列不存在显著的自相关性。

2.      厚尾分布:中上子图为标准化单侧收益率的累积概率分布P(r>x),该函数衰减越快,表明分布越接近正态分布;衰减越慢,表明分布越接近厚尾分布。

3.      波动率聚集:右上子图为收益率绝对值序列的k=1~120阶时滞自相关系数,观察可知,上证综指的收益率绝对值序列存在较强的低阶时滞自相关,而高阶自相关性趋于零。

4.      杠杆效应:左下子图展示当前收益率和未来波动率的时滞相关性,观察可知两者低阶负相关,高阶不相关。

5.      粗细波动率相关:中下子图蓝色点线为粗波动率滞后细波动率k期的相关系数,橙色点线为±k阶相关系数的差值,该差值刻画粗细波动率间相互预测能力的差异;橙色点线低阶为负值,表明当前细波动率对未来粗波动率的预测能力更强。

盈亏不对称性:右下子图红点和蓝点分别代表实现累计盈利和亏损超过10%所需的最少交易日数;红色分布峰值位于蓝色分布峰值右侧,表明涨得慢跌得快。

我们使用训练好的DCGAN随机生成1000条多资产收益率序列,从中提取上证综指对应的收益率序列,计算1000条序列前6项单资产序列评价指标并求均值,最终汇总计算结果如下图所示。结果表明,DCGAN的生成效果不理想,难以准确复现自相关性(左上子图)、杠杆效应(左下子图)和盈亏不对称性(右下子图)。

我们使用训练好的W-DCGAN随机生成1000条多资产收益率序列,从中提取上证综指对应的收益率序列,计算1000条序列前6项单资产序列评价指标并求均值,最终汇总计算结果如下图所示。结果表明,W-DCGAN能够较好地复现真实序列的各项典型化事实。

计算6项单资产序列评价指标的统计量。真实序列和DCGAN、W-DCGAN和WGAN三种生成方法在前6项评价指标上的表现汇总如下表所示。其中,自相关性方面,DCGAN生成序列自相关系数波动较大,效果较差;厚尾分布方面,三种生成方法均表现出色;波动率聚集、粗细波动率相关和盈亏不对称性方面,W-DCGAN比其他方法更接近真实序列;杠杆效应方面,尽量统计量和真实值略有偏差,DCGAN和W-DCGAN生成序列总体复现出了低阶负相关高阶不相关的现象。就前6项单资产序列评价指标而言,DCGAN生成效果不理想,W-DCGAN生成序列较为“逼真”,且复现效果相比于WGAN更接近真实序列。

下面展示各模型在方差比率检验指标上的表现。图表33至35中的蓝色虚线表示真实序列各阶方差比率检验统计值,箱线图代表1000条生成序列在各阶方差比率检验统计值分布。真实序列表现出短期(阶数2~10)随机游走,即低阶方差比率检验统计量落在[-1.96,1.96]的范围内;高阶(阶数50~100)非随机游走,即高阶方差比率检验统计量落在[-1.96,1.96]的范围外。总体来说,DCGAN 、W-DCGAN与WGAN 的生成序列都未能完美复现出这一特征,但W-DCGAN生成序列的方差比检验统计量与真实序列更为接近。

DCGAN、W-DCGAN、WGAN 生成序列的Hurst指数值如下图所示。上证综指序列真实 Hurst 值为0.55,表现出弱长时程相关特征。W-DCGAN生成序列Hurst值在[0.53,0.56)区间内频数较高,且有57.4%的Hurst值大于0.5,很好地体现出了弱长时程相关的特征,并且可以观察到其Hurst值分布在DCGAN生成序列的右侧,和WGAN接近。

为验证生成序列多样性,我们从DCGAN模型生成的1000 条上证综指日频假序列中随机抽取 1000组配对序列,计算这 1000 组配对序列之间的 DTW 指标,对W-DCGAN生成序列也进行同样的操作。两个模型的DTW分布如下图所示。整体上看来,W-DCGAN生成样本序列之间的DTW值分布位于DCGAN右侧,WGAN生成样本序列之间的DTW值分布位于W-DCGAN右侧,这意味着在生成序列的多样性上,WGAN优于W-DCGAN优于DCGAN。这印证了W距离的引入确实从根源上解决了原始GAN模型多样性低相似度高且容易模式崩溃的不足。

多资产序列评价指标

进一步考察两对资产收益率序列——标普500和上证综指、标普500和欧洲斯托克50的多资产序列评价指标。特别地,由于三资产系统自由度为2,通过两对资产的表现大致能推断第三对资产的表现,因此这里不再展示上证综指和欧洲斯托克50的结果。

我们依次对真实序列的各项评价指标进行分析,并从中提取真实序列的典型化事实:

1.     交叉相关性:两图中的左上子图展示两收益率序列的k=0~120阶时滞交叉相关系数。观察可知,标普500和欧洲斯托克50存在显著的0阶和1阶正相关性,标普500和上证综指存在一定0阶和1阶正相关性,体现出全球股票资产的联动性。此外,两对资产之间均不存在显著的更高阶交叉相关性。

2.     波动率相关性:两图中的右上子图分别展示两对资产收益率的绝对值序列之间的交叉相关系数。观察可知,两对资产均存在低阶的波动率正相关性,其中标普500与欧洲斯托克50之间的波动率正相关性更为显著。

3.     交叉杠杆效应:两图中的左下子图展示一种资产当前收益率与另一种资产未来波动率之间的时滞相关性。观察可知,两对资产之间均存在低阶负相关,其中标普500与欧洲斯托克50之间的负相关更为显著,持续阶数更多。

4.     滚动相关系数分布:两图的右下子图展示两对资产之间滚动相关系数的经验密度估计,黑色虚线标明分布的峰值位置。其中,标普500与上证综指的滚动相关系数分布接近对称分布,对称轴略大于0,说明两者之间存在微弱的正相关关系;而标普500与欧洲斯托克50的滚动相关系数分布为非对称分布,峰值位于0.9附近,说明两者之间存在较强的短期正相关性。从图中还能看到,两资产之间的短期相关关系并不稳定,尤其是标普500与上证综指,其短期相关关系正负不定。

5.     极端值相关性:不适合作图,将在后文单独讨论。

使用训练好的DCGAN随机生成1000条多资产收益率序列,针对本节考察的两对资产,计算1000条序列各项多资产序列评价指标并求均值,最后汇总计算结果,如下面两张图所示。结果表明,DCGAN不能很好地复现交叉相关性(左上子图),显示出了高阶亦相关的特性;在杠杆效应上(左下子图)亦出现失真;在标普500和上证综指的滚动相关系数分布上(右下子图),原本真实序列的弱正相关被错误表现成了弱负相关。

使用训练好的W-DCGAN随机生成1000条多资产收益率序列,针对本节考察的两对资产,计算1000条序列各项多资产序列评价指标并求均值,最后汇总计算结果,如下面两张图所示。结果表明,W-DCGAN能较好复现真实序列的各项典型化事实。

 WGAN结果如下面两张图所示。WGAN在相关性指标上的整体表现较好,接近真实序列。

计算各项多资产序列评价指标的统计量,真实序列和各种生成方法在各项评价指标上的表现汇总如下面两张表所示。相对于DCGAN和WGAN,W-DCGAN在各项多资产序列评价指标中的表现均更为优异:

1.     交叉相关性:真实的多资产收益率序列呈现0阶和1阶正相关性、高阶无显著交叉相关性;DCGAN生成序列高阶存在显著交叉相关性,W-DCGAN和WGAN能较好地复现两个股指间低阶显著正相关、高阶无显著相关的特性。

2.     波动率相关性:真实的多资产收益率序列呈现正的低阶波动率相关性;W-DCGAN能够复现标普500与欧洲斯托克50的低阶波动率相关性,但未能复现出标普500与上证综指的低阶波动率相关性,相比之下DCGAN和WGAN表现更好。

3.     交叉杠杆效应:在真实的多资产序列中,一种资产的当前收益率与另一种资产的未来波动率之间存在低阶时滞交叉相关性;DCGAN复现效果不佳,W-DCGAN和WGAN均表现较好。

4.     滚动相关系数分布相似度:尽管从经验密度估计图中看到,两种生成方法的结果都比较接近真实序列的结果,然而对真实序列和两种生成方法得到的滚动相关系数分布开展双样本AD检验发现,各种生成方法生成的滚动相关系数分布在5%显著性水平下与真实分布存在差异。不过相较于DCGAN和WGAN,W-DCGAN的结果具有更小的检验统计量和更大的p值,表明W-DCGAN的滚动相关系数分布更接近真实分布。

极端值相关性:标普500和欧洲斯托克50之间存在显著的极端值相关性;相较于DCGAN和WGAN,W-DCGAN能更好地复现真实序列的这一典型化事实。

总结与展望

本文探讨GAN模型的一类重要变式——DCGAN在生成多资产金融时间序列中的应用。和WGAN针对损失函数改进的思路不同,DCGAN的核心思想是针对网络结构改进原始GAN。DCGAN使用更灵活的转置卷积层和带步长的卷积层,分别替代GAN模型中的上采样层和池化层。同时,DCGAN取消全连接层,并调整归一化层、激活函数、优化器等网络组件,使生成器和判别器均为全卷积网络结构。

尽管在网络结构上更为合理,DCGAN并没有解决GAN模型的根本缺陷,并且仍需要小心设计训练过程及网络参数,调参难度较大,单纯使用DCGAN模型在实践中效果并不理想。本文对DCGAN模型做进一步改进,借鉴WGAN模型思想,将W距离应用于DCGAN的损失函数中,构建W-DCGAN模型。W-DCGAN不仅拥有DCGAN的原本优势,还由于W距离的使用避免了梯度消失和模式崩溃现象。

我们测试各类生成模型在多资产金融时间序列(标普500、上证综指、欧洲斯托克50)生成任务中的表现,并采用前期研究构建的9项单资产序列指标和5项多资产序列指标评价生成质量。结果表明,DCGAN在自相关性、杠杆效应、盈亏不对称性、多资产交叉相关性等指标上生成效果不佳,W-DCGAN和WGAN均表现较好;W-DCGAN总体而言略胜一筹,在盈亏不对称性、Hurst指数、多资产滚动相关系数等指标上有显著优势。总的来看,W-DCGAN模型能较好地复现出真实序列的各项典型化事实。

本文基于真实多资产序列的典型化事实,验证了W-DCGAN在生成多资产收益率序列方面的能力。下面问题值得进一步探索:

1.      本文提出的多资产序列评价指标大部分局限于两类资产间。或可设计同时考察k>2类资产收益率的评价指标,如资产协方差矩阵的特征值等,从而对W-DCGAN生成能力及局限性有更深入的认知。

2.      W-DCGAN模型的网络结构存在可视化训练中间结果和向量相加的能力,在本研究中并未充分利用。或可更加深入探究W-DCGAN模型训练过程,揭开GAN模型黑箱。

参考文献

Arjovsky, M., & Bottou, L. (2017). Towardsprincipled methods for training generative adversarial networks. arXiv preprintarXiv:1701.04862.

Cont, R. (2001). Empirical properties of asset returns: Stylizedfacts and statistical issues. Quantitative Finance, 1(2), 223–236.

Chakraborti, A. , Toke, I. M. , Patriarca, M. , &Abergel, F. . (2011). Econophysics review: i. empirical facts. QuantitativeFinance, 11(7), 991-1012.

Lecun, Y. , & Bottou, L. . (1998). Gradient-based learning applied to document recognition.Proceedings of the IEEE, 86(11), 2278-2324.

Odena, A. , Dumoulin, V. , & Olah, C. . (2016).Deconvolution and checkerboard artifacts. Distill, 1(10).

Radford, A. , Metz, L. , & Chintala, S. . (2015).Unsupervised representation learning with deep convolutional generativeadversarial networks. Computer Science.

风险提示

DCGAN和W-DCGAN生成虚假序列是对市场规律的探索,不构成任何投资建议。深度学习模型存在过拟合的可能。深度学习模型是对历史规律的总结,如果市场规律发生变化,模型存在失效的可能。

温馨提示:本报告所载观点源自04月13日华泰证券金工林晓明团队发布的研报《人工智能44:深度卷积GAN实证》,对本材料的完整理解请以上述研报为准。

风险提示DCGAN和W-DCGAN生成虚假序列是对市场规律的探索,不构成任何投资建议。深度学习模型存在过拟合的可能。深度学习模型是对历史规律的总结,如果市场规律发生变化,模型存在失效的可能。

研究员:林晓明  S0570516010001/BPY421、李子钰  S0570519110003、何康 S0570520080004

扫二维码,3分钟极速开户>>

免责声明:自媒体综合提供的内容均源自自媒体,版权归原作者所有,转载请联系原作者并获许可。文章观点仅代表作者本人,不代表新浪立场。若内容涉及投资建议,仅供参考勿作为投资依据。投资有风险,入市需谨慎。

海量资讯、精准解读,尽在新浪财经APP
改进 GAN 资产

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 04-19 财达证券 600906 --
  • 04-16 华生科技 605180 22.38
  • 04-15 中红医疗 300981 48.59
  • 04-15 苏文电能 300982 15.83
  • 04-15 味知香 605089 28.53
  • 股市直播

    • 图文直播间
    • 视频直播间
    新浪首页 语音播报 相关新闻 返回顶部