《中国金融》|阮健弘:大数据技术提升金融统计分析能力

《中国金融》|阮健弘:大数据技术提升金融统计分析能力
2022年01月18日 10:58 中国金融杂志
  导读:在基础数据层面全链条治理的基础上,运用大数据技术让金融统计分析更“实”,更“全”,更“快”和更“准”

  作者|阮健弘‘中国人民银行调查统计司司长、金融基础数据中心主任’

  文章|《中国金融》2022年第2期

  大数据、人工智能的出现和应用,为金融统计分析工作的高质量发展提供了坚实基础。近年来,全球主要央行在金融统计分析方面加快应用大数据技术,在分析经济金融运行、预调微调货币政策、前瞻识别金融风险等方面提供了关键支撑。人民银行认真贯彻落实习近平总书记关于金融业综合统计的指示精神,在基础数据层面全链条治理的基础上,守正创新,稳中求进,运用大数据技术让金融统计分析更“实”,更“全”,更“快”和更“准”。

  大数据技术让金融统计分析更“实”

  大数据技术有效填补数据缺口,打破统计“数据孤岛”,让底层数据更“实”

  大数据技术显著提升数据采集和数据挖掘的效率,增强金融统计数据的可得性,显著扩大数据分析维度和覆盖范围,有效缓解信息不对称问题。

  一是从传统的样本数据升级为“全量数据”,极大增加了数据信息量。在大数据时代,统计数据从少量、静态、单一的样本数据转变为海量、动态、多样的“全量数据”,样本更多、数据颗粒度更细、数据维度更多。对大数据技术的应用,扩大了数据的覆盖面,提高了数据的时效性,使数据资源的容量得到极大提升。

  二是有助于打破统计“数据孤岛”,深度挖掘数据之间的关联关系。数据的知识图谱、人工智能等技术方法可以迅速将海量数据进行智能关联和分析挖掘,可以有效应用于货币政策评估、风险监测、压力测试等领域,从而弥补传统分析方法在处理海量数据方面的诸多不足。

  三是数据呈现方式多元化,可视化技术提升数据的可接受度。随着云计算、数据挖掘、数据可视化等大数据技术分析方法的发展,大数据产品日趋多样化、目录化,基于追踪、画像、提示、匹配、优化等多种功能,可以根据不同的场景开发对应的可视化工具,以满足特定的数据需求,精准实现数据供需匹配。

  大数据技术突出问题导向,提升数据生产效率,满足数据使用需求能力更“实”

  面对日益增长、复杂多变的数据需求,统计供给出现了一些挑战。一是关联性统计的挑战。实现数据之间的联动分析、钻取分析,才能更好地展现经济金融现象间的有效联系。二是灵活性的挑战。各类结构性政策的制定与实施迫切需要多角度的灵活数据展现。三是时效性的挑战。由于热点重点问题切换太快,从数据需求的提出到需求的满足,要求的时间越来越短。

  大数据技术能有效改善金融统计需求和供给的关系,数据使用方能够从数据源头对金融统计供给提出需求。一是大数据智能工具的发展,使数据加工处理和分析应用更加便利高效,数据需求方可以轻松了解数据标准、数据来源与结构,实现数据的高效利用。二是通过细颗粒度的基础数据和集中的数据存储,为应对复杂问题提供更加精细和关联性更强的数据源。三是使用方更熟悉供给,提高金融统计数据的响应效率。在大数据技术支持下,统计更加便捷,多数数据挖掘可以智能实现,能极大程度提高统计效率。

  大数据技术在实践中不断突破,形成了一批高水平金融大数据分析人才,协同工作能力更“实”

  金融统计服务的内涵外延和深化,不仅包含统计报表,还包括数据分析,而且数据分析工作还是连接统计供需的桥梁。大数据技术的快速发展,打破了数据融合分析应用的技术壁垒,深刻影响着分析人员进行数据搜集、挖掘、整理、加工和分析的全链条工作,对分析人员的能力素质也提出了更高要求。

  我们在利用大数据技术助力金融统计分析能力提升方面开展了多方面理论探索和实践,在干中学,在学中干,将大数据技术与金融统计紧密结合,注重实操和工作落地。围绕“建设符合现代中央银行需要的经济金融大数据统计复合型人才队伍”,在金融数据分析人才的培训途径、培训方案方面进行了创新。大数据与金融深度融合,催生层出不穷的新业态新模式。对于金融数据分析人才来说,大量的数据分析工作需要跨部门调集领军人才,组建攻坚团队。目前,在中国人民银行党委领导下,金融基础数据中心正在积极探索人才工作新思路和新举措。以建设国家战略人才力量为目标,围绕“高精尖缺”人才,探索形成领军人才、创新团队和青年后备人才团结协作、接续奋斗的人才梯队。

  大数据技术让金融统计分析更“全”

  一是以分析为驱动,建立维度更“全”的金融基础数据统计制度,从600多个细颗粒维度采集金融基础数据。在传统的统计框架下,从数据统计到实现分析的流程较长,统计供给在满足日益丰富的分析需求方面存在困难。要满足多样分析需求,需要建立信息含量丰富、使用灵活的分析型数据库。2020年7月,人民银行建立金融基础数据统计制度,金融基础数据统计制度以标准化逐笔统计方式,涵盖存款、贷款、同业、债券、股权、特定目的载体等各类金融工具、600多个维度指标,以及金融机构信息和客户信息等明细数据。数据采集范围覆盖全国所有的银行业金融机构。统计制度通过统一的机构代码、工具代码和客户代码实现数据的连通、融合,大大拓展了统计数据的广度和深度。金融基础数据库以服务金融分析为主、编制统计报表为辅开展工作,金融统计数据服务分析需求的能力大幅提升。

  二是以分析为驱动,制定以人工智能为主导的更“全”的数据质量治理体系。大数据的金融统计内容较多,采用传统方式进行数据质量治理存在效率不高的问题,需要制定新的数据质量治理体系,一方面,运用大数据的方法设计算法,发现数据质量问题;另一方面,将分析中发现的问题及时形成校验规则,不断丰富校验规则库,稳步提高数据质量。通过数据地图实现数据资产智能管理。数据地图主要面向数据开发者,汇聚用户所有数据信息,通过元数据信息收集、数据血缘探查、数据权限申请授权等手段,完成数据信息的收集和管理。分析人员通过数据地图工具能够实现数据的统一查询,解决“有哪些数据可用”“到哪里可以找到数据”的难题,并且提升数据资源的利用率。

  三是以分析为驱动,构建分析视角更“全”的数据结构模型体系。数据结构模型关乎数据信息的组织方式。良好的数据结构模型能够为算法运行提供服务。在金融研究中,分析人员往往从现实问题出发,确定分析主题,建立分析目标,设定模型算法。模型算法从海量数据入手,通常复杂度较高,运行时间较长,系统资源耗用较多,这就对如何提升效率提出了更高要求。分析人员能够根据数据的内在关联性,挖掘出数据的结构性特征,从而构建具有层次、网状、关系的数据结构模型体系,为模型算法的高效运行做好前置性工作。

  从最终效果看,大数据技术保障分析的驱动力切实可行、行之有效。从实践看,数据供给到需求的链条大大缩短,这需要大数据技术的保障,使得数据供给更加简单,容易操作。目前,大数据技术主要通过三种手段提供保障。一是实现大量数据的集中存储,包括大部分数据需求;二是以分析需要规划建设数据中台,分层管理数据,实现数据的快速调用;三是提供了更多的便捷式工具,使数据使用更便捷。大数据技术在这三个方面不断完善,使分析驱动的统计业务能够可持续发展。

  大数据技术让金融统计分析更“快”

  一是熟练使用数据字典,探查数据血缘关系,实现数据“快速”关联穿透提升分析深度。数据字典是描述数据的信息集合,是对数据项、数据结构、数据流、数据存储及处理逻辑进行定义和描述的目录。在海量数据的汇总分析中,分析人员往往首先观测到异常指标。在由指标到记录、由宏观到微观,追根溯源式地拆解指标、挖掘指标异常变化原因的过程中,查阅数据字典如同浏览数据加工厂生产线的纪录片,对于回溯指标“前世今生”、探查数据血缘关系、实现数据有效穿透意义重大,是提升分析深度、提高分析效率的利器。

  二是熟练操作数据库,跨领域“快速”开展数据融合应用。使用ETL工具,打通各平台数据库,实现跨领域多源数据融合。根据分析目标,利用关联、筛选、计算、排序、分类汇总等多种数据库数据处理手段,有针对性地构造融合数据集。融合数据集具有多领域的丰富维度,各领域数据之间能够相互印证,从而检验数据的准确性和真实性。使用融合数据集在提高数据利用价值的同时,也有效拓展了金融统计分析的广度。

  三是熟练加工处理数据,“快速”洞察数据质量,提升数据分析可信度。从人民银行金融基础数据治理的实践来看,数据治理范围涵盖了金融机构端业务数据库、金融基础数据采集平台和终端大数据平台。其中,大数据平台的数据治理主要通过数据分析展开。由于数据分析能够从应用角度出发,方便观测到异常汇总指标,并具有跨表、跨周期的数据检验能力,因而成为开展数据治理最重要的环节。分析人员能够通过多样的分析手段和工具,在有效识别脏数据、评估数据报送质量、对银行端形成信息反馈的同时,也提升了应用数据的可靠性,为分析结果的可信度提供了坚实的数据基础。

  四是熟练使用大数据智能分析工具,钻取数据底层的逻辑,“快速”提高分析关联度。大数据智能分析涵盖了数据加载、统计挖掘、关联分析及可视化等内容。熟练使用大数据智能分析工具,整合多源数据,穿透钻取数据底层的关联逻辑,实现对数据的深层次探索挖掘。熟悉数据多源特性,接入和整合多种异构源数据,对多源数据进行标准化和规范化处理,根据相同字段对数据进行动态关联,完成大规模数据的快速整合。利用统计挖掘功能,对数据进行基本的探索分析。按照场景需求,创建自定义度量指标,并利用统计、筛选、排序等功能,有针对性地对数据进行挖掘分析,自定义实现可视化的图表内容。运用联动分析功能,挖掘数据底层关联关系。通过使用下钻、上卷、旋转、联动等功能,实现基于不同分析维度,对图表内容的穿透钻取,立体、多角度地挖掘数据的关联关系,洞察数据背后的深层次问题。

  大数据技术让金融统计分析更“准”

  一是围绕党和国家大局,加强形势预研预判,为宏观调控提供前瞻性、针对性信息支持。习近平总书记在党的十九大、全国金融工作会议上,强调服务实体经济、防控金融风险、全面深化改革,这对我国宏观调控提出新要求。近年来,国内国际形势复杂严峻,在新冠肺炎疫情冲击下,全球经济的深层次问题更快更彻底地显现,我国经济增长动能、经济结构也都在悄然改变,这对央行履职提出了新挑战,对形势分析的前瞻性、精准性和靶向性提出了更高的要求。应加强形势预研预判,下好先手棋、打好主动仗,更快、更准地捕捉经济发展的规律性变化,监测经济金融运行的趋势和拐点,前瞻性做好政策储备。与此同时,大数据技术助力金融统计实现跨越式发展,为形势分析提供了更为丰富、精准、及时的数据资源,数据综合分析应用的场景也不断丰富。针对同业业务、银行企业共贷关系等热点问题,强化对重点领域的风险监测和评估,助力防范化解金融风险;开展疫情防控复工复产调查、居民收入恢复情况调查,助力服务实体经济。大数据技术助力形势分析更加高效、精准,为宏观调控政策决策提供更高效的信息支持。

  二是充分发挥“情报站”“信息港”功能,有效开展舆情监测。随着信息技术的快速发展,公众获得的信息量呈指数型增长,公众利用公开信息能更及时捕捉宏观政策操作意图,但也容易产生一致性预期错判情况。因此,如何从正面加强舆情监测和引导公众预期是一个重大问题。及时发现公众一致性预期错判,进行合理引导,能有效避免微观行为主体预期错判影响宏观调控政策效果。大数据技术为有效开展舆情监测提供了可能,也是提升数据治理能力的一个有益尝试。充分发挥海量数据的“情报站”“信息港”功能,我们尝试开展公众货币政策松紧度感受、两会期间金融热点舆情监测等分析应用,有效填补了数据缺口,为宏观决策提供信息支持。

  三是及时跟踪政策方向,利用快捷、灵活、广覆盖的经济监测“信息港”体系,围绕经济结构转型等重大问题,提供信息支持。通过对大数据信息的深度挖掘和分析,形势分析的广度和深度均明显延展。坚持以需求、问题为导向,围绕经济金融领域的热点和难点问题,利用大数据技术,深入解剖和展现复杂经济金融运行中的各种结构性问题,迅速响应、精准聚焦政策方向和经济金融领域潜在问题、苗头性趋势,高效服务精准调控的宏观政策。

  四是熟练运用机器学习模型,做好模拟和预测,提高分析精细度。机器学习模型是挖掘大数据核心价值的有效方法。理解机器学习模型的运作原理,熟练运用机器学习模型,抽象出数据潜在的知识和规律,并对未知数据进行预测和分析,有助于提高金融分析的精细度。了解机器学习模型的理论逻辑,实现不同需求和环境下机器学习模型的构建、运行和部署。在特定金融分析场景中应用机器学习模型,做好模拟和预测。例如,利用机器学习模型模拟研究产业政策、经济事件、金融环境等真实社会状态,对政策实施、金融风险等特定事件的产生机制和影响因素进行推演,实现对特定事件发生的提前预判和有效评估。利用多维度数据更新优化模型,提高模型的泛化能力。随着金融业综合统计工作的稳步推进,金融统计数据量快速增长,使用多源、高维度的数据对模型进行迭代更新,完善模型的金融场景适用性,提升模型的预测效果,拓宽模型的应用范围。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:李琳琳

大数据 阮健弘 中国金融
人气榜
跟牛人买牛股 入群讨论
今日热度
问股榜
立即问股
今日诊股
产品入口: 新浪财经APP-股票-免费问股
产品入口: 新浪财经APP-股票-免费问股
产品入口: 新浪财经APP-股票-免费问股

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 02-09 比依股份 603215 --
  • 02-09 标榜股份 301181 --
  • 02-08 华兰疫苗 301207 56.88
  • 02-07 中触媒 688267 41.9
  • 02-07 合富中国 603122 4.19
  • 产品入口: 新浪财经APP-股票-免费问股
    新浪首页 语音播报 相关新闻 返回顶部