大数据300指数基金分析:双轮驱动群体造就市场

2015年06月16日 16:07  新浪财经 微博 收藏本文     

确定
入市有风险,投资需谨慎

  来源:德圣基金研究中心

  6.32亿的PC网民、5.5亿的手机网民、1亿的新生代股民每天都在产生大量的网络数据,基于投资者群体行为研究以及网络痕迹“画像”的大数据分析带来了市场上一类新型投资模式,并以其显著的超额收益吸引眼球。基于大数据投资模型的i100与i300指数应时而生,投资者在牛市狂潮中可以以两大指数为核心,构建投资壁垒,分享数据蓝海。

  “互联网+金融”这一组合,无疑是本轮牛市中最符合国策,最切中潮流的投资选择,而大数据指数基金既发挥了“盯住市场”的优势,又吸收了互联网数据的力量,一举成为基金行业产品创新的一匹黑马。这从火爆的销售状态就可见一斑,南方大数据100指数基金在2015年4月22日发行,单日募集完毕,配售比例约为27.88%,是今年来配售比最低的新发基金,5月28日开放一天申购赎回后又马上关闭。对于遗憾错失了南方大数据100基金的投资者而言,大数据指数的另一匹黑马——南方大数据300指数基金(A类001420 C类001426)提供了参与这类高价值策略指数的投资机会。在一个游戏不止,股市长牛的泡沫中,投资者可以以i300和i100为支撑构建投资壁垒,坚持两手抓,两手都要硬,之所坚持这样的策略,下文中我们从回测收益、群体行为、情绪挖掘等各个层面为投资者进行阐述。

  双轮驱动构建投资壁垒

  从长期累积收益来看,大数据系列指数历史收益率良好,i300显著强于其他指数,i100略强于i300。从年度收益来看,i100在大多数年度里面略强于i300指数,但是i300指数要显著强于沪深300、上证综指、深证成指,而仅仅在近半年才落后于中证500指数。截止到2015年6月12日数据显示,大数据300指数自基日(2010年1月29日)至今,累计收益率为272%。近半年一季度该指数累计收益率为60.51%,近一年累计收益率为112.99%;近三年年化日收益波动率为24%,近五年年化日收益波动率为23.92%。

图1:大数据指数与宽基指数收益率对比图1:大数据指数与宽基指数收益率对比
图2:大数据指数与宽基指数收益率图2:大数据指数与宽基指数收益率

  从近半年走势来看,i100与i300表现出明显的风格区别。根据指数走势的模拟图,i100指数趋于中小盘成长风格,今年以来走势与创业板板指较为接近;而i300指数则趋于蓝筹价值风格,今年以来走势接近沪深300指数。这也是我们坚持要两手抓,两手都要硬的重要原因,由于成长与价值、大盘与小盘的轮动是A股市场永远的话题,所有从指数组合上看并不能过分偏向某个方向。

  【总的来看,i100与i300长期累积收益要强于其他宽基指数,其长期投资的价值较大,而i100与i300阶段性的表现出显著的风格差异,按照市场机会不在此就在彼的特征,i100与i300混搭构建的投资壁垒可以把握住这个市场上大量的投资机会】

图3:i100与i300风格模拟图3:i100与i300风格模拟

  群体造就市场   数据“画像”情绪

  为什么i100可以横扫市场,i300被翘首以盼呢?本质上说,碎片数据、关键词跟踪在跟踪金融投资方面能够产生效果,其根本的原因在于情绪作为人类对于刺激的内在本能反应,是金融决策中不可分割的一部分。

  如何合理而有效的发现投资者的真实情况是模型化之前的关键点,要实现这一目标仍要从投资行为决策过程出发。一个买入卖出行为的产生要经历信息的搜索、信息的评估以及相互验证、最后形成成交量。而关键词搜索模型之所以能够有效,就是因为它领先于成交量(成交量是情绪的最真实反映),通过信息搜索的过滤以及识别,提前发现投资者的市场情绪。

  互联网的高速发展使其成为普通投资者获取信息、验证信息的最重要渠道,而众多投资者留下的网络痕迹为模型的实战提供了土壤,在此之前这似乎是不可想象的。最为关键的地方在于,他们的行为可以进行研究、标绘,甚至在某种程度上可以预测。

  目前利用情感分析进行金融投资的方法主要是关键词检索。比如美国印第安纳大学Huina Mao和Johan Bollen与微软[微博]研究员Scott Counts利用Twitter数据定义的情绪指标,其规则是如果一条Twitter中包含了“牛市”这个词,那么就认为这条Twitter是看多的;反之,如果Twitter中包含了“熊市”,就认为该Twitter是看空的。统计出一天内看多和看空的Twitter的数量,再基于此定义投资者情绪得分,即投资者情绪指标。从检验统计的结果上看,该指标对股指有较强的预测性。

  而i100与i300在计算市场情绪因子时是这样做的:

  1、根据新浪财经频道下的股票页面访问热度计算单个股票的热度得分;

  2、根据财经频道下的新闻报道正负面影响计算单个股票新闻报道得分;

  3、根据股票在微博上的正负面文章影响计算单个股票微博得分;

  4、综合上述得分并根据历史回测优化结果作为大数据得分。

  【剑桥大学行为经济学家米歇尔•巴德利说:“无论是现实群体还是虚拟群体,只要具有集体意识,就都可能出现相似的从众行为。一些研究显示,只要想象一个情境就足够了,没有必要真的身临其境。而且人们的情绪很容易就能由虚拟情绪调动起来,比如在电脑游戏和网络世界当中。” i100与i300指数采用多重规则编制,并不是简单的多空分析,本土化的改造使其更具备实操性。】

  量级数据支撑

  从数据源看,i100与i300的市场情绪因子来自语新浪财经与微博所覆盖的用户,而这批用户是股票市场投资群体一个典型的样本,其所包含的相关股票市场信息具有代表性:

  其一,新浪财经是目前国内财经领域新闻性、权威性、及时性做得最出色的频道之一,拥有实时的、丰富的中文财经媒体内容,同时也覆盖了不同年龄、职业、地区、教育程度、财富水平的财经用户。用户在新浪财经对行情的访问热度、对股票的搜索热度以及用户在新浪财经对股票相关新闻的浏览热度能充分体现市场热点;

  其二,新浪旗下的微博是国内最大的社交媒体之一,微博公司2014年四季度季报显示,微博月活跃用户数为1.76亿,较上年同期增长36%。微博日均活跃用户数为8,060万,较上年同期增长31%。基于大规模用户基础的微博数据,能进一步体现投资者对股票的多空预期。

  【6.32亿的PC网民、5.5亿的手机网民、1亿的新生代股民每天都在产生大量的网络数据,新浪财经作为主流阵地汇集了真正的“大数据”,量级的数据使得指数为投资者或者单个股票的“画像”更加贴近于市场,增强“预测”的准确性。】

 图4:新浪大数据可视化 图4:新浪大数据可视化

  传统因子增强安全边际

  大数据策略因子能体现市场情绪动向,但不能体现出上市公司的盈利状况、基本面估值、成长属性等信息,缺乏一定的安全边际,而且没有业绩支撑的股票,其价格也很难有长期持续优秀的表现。因此,除了大数据策略因子外,在筛选成份股时,南方基金也综合考虑了另外两个因子。

  在编制指数时选股时,南方量化投资部门根据市净率PB、市盈率PE、净资产收益率ROE等指标构建了财务因子,根据股票换手率、波动率、价格变化率等指标构建了市场驱动因子。最终,综合三大策略因子建立了一个系统的股票筛选机制,精选出具有超额收益预期的股票。大数据300指数是基于成份股筛选机制,精选出综合排名靠前的300只股票组成的指数样本股。

  【尽管传统因子能够提供的超额收益的逐步收窄,但是基于财务模型而形成的股票池仍然为投资提供了较强的安全边际,i系列指数因此兼具进攻性与安全性,也是其长期投资价值突出的关键所在。】

图5:大数据指数构造过程图5:大数据指数构造过程

  总的来说,此次大数据系列指数是大数据在金融领域应用的一次很好的尝试。作为国内独家利用社交媒体进行大数据选股的策略指数系列,继100指数后,南方大数据300指数基金再次为为投资者提供具体的投资工具,使其分享大数据分析与挖掘策略所创造的价值。对于投资者而言,我们暂且不去判断牛市将会终结于何时,但是在目前市场情绪高昂的环境中,基于情绪而来的大数据指数无疑更接底气、更接近于投资的本源,希望i100+i300双轮驱动构建的投资壁垒能够为投资者带来满意的回报。

  (德圣研究部高级分析师 郭现孟)

附表:南方大数据300(A类:001420)费率结构附表:南方大数据300(A类:001420)费率结构

  如何认购大数据300指数基金

  新浪财经讯 南方新浪大数据300指数基金(代码:A类001420 C类001426) 6月15日-19日发行,超百家银行券商有售(名录)。15日上午9:00 起即可通过南方基金官网或南方基金APP 开抢,享受汇款申购0费率优惠(图解流程),本次认购截止时间是19日下午15:00。

  图解官网、券商、网银等申购方式

  0费率申购APP的下载地址可以点击这里:南方基金APP。也可以在手机应用市场搜索“南方基金”进行APP下载。

  此外,我们为新投资者准备了“认购秘籍”,开放认购常见问答手把手教你三分钟开户0费率认购大数据300基金大数据300指数基金专题。如有更多疑问,可咨询南方基金客服专线:400-889-8899 转 8 (大数据300客服专线),再转0 (人工坐席)。

  大数据300指数基金追踪的i300指数由南方基金、新浪财经和深证信息公司联合推出,在选股因子中创新性地融入了互联网财经大数据。通过对新 浪财经在财经领域的“大数据”进行定性与定量分析,同时考量股票基本面与市场驱动情况,精选出综合排名前300的股票组成指数样本股,每季度进行调仓,一 网打尽牛市蓝筹。i300指数(399416)与日前已成功发行指数基金的i100指数(399415)在编制框架、数据来源、研发团队等方面一脉相承,自正式公布大数据300指数基金发行日期后,受到市场广泛关注。

  作为一只宽基指数,i300表现突出。据Wind数据,截至6月12日,i300指数今年以来累计上涨60.50%,同期沪深300指数仅上涨50.98%。

新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

文章关键词: I300指数基金大数据基金

分享到:
收藏  |  保存  |  打印  |  关闭

已收藏!

您可通过新浪首页(www.sina.com.cn)顶部 “我的收藏”, 查看所有收藏过的文章。

知道了

0
猜你喜欢

看过本文的人还看过

收藏成功 查看我的收藏
  • 新闻国家工商总局原副局长孙鸿志受贿通奸
  • 体育勇士4-2夺NBA总冠军 詹皇连续两年饮恨
  • 娱乐好声音首轮:周杰伦为“情敌”转身后悔
  • 财经党报:出租车改革不是专车合法化那么简单
  • 科技三大运营商被指有人内外勾结蚕食国资
  • 博客男子砍死强暴妻子者被判无期合理吗
  • 读书优劣悬殊:抗美援朝敌我装备差距有多大
  • 教育大学生惊悚毕业照走红(图) 往年分数线
  • 专栏李银河:官员通奸与任职资格的三种关系
  • 叶檀:美大公司钱太多 有必要加息
  • 肖磊:A股下跌风险主要由散户承担
  • 易宪容:当前A股为何会暴涨暴跌
  • 明天的天:在股市熊市不吃人牛市吃人
  • 杨红旭:股市和楼市谁能笑到最后?
  • 洪榕:如何应对这次A股的真调整
  • 梁建章:中国进入“人口危机”时代
  • 姚树洁:股民赌瘾没满足 6000后歇菜
  • 尹中立:中国神车可能是股市的风向标
  • 叶檀:这就是痛苦的慢牛