2017年12月16日11:54 新浪财经

  新浪财经讯 “第十四届中国国际金融论坛”于2017年12月14-15日在上海召开。论坛主题:金融本源回归服务实体经济发展,成都数联铭品科技有限公司首席征信官朱劲杰出席并演讲。

  以下为发言实录:

  朱劲杰:各位同仁,各位先生、各位女士上午好。我是来自成都数联名品,这个公司今年是一个baby,才四岁,2013年3人3万公司起家,现有员工500人,市值30亿,我们这个公司只干一件事儿,就是做企业的信用行为数据库,为金融监管和政务监管服务。下面我们把怎样做这件事向各位专家汇报一下。

  我们这个公司是现在收集了全国3100万法人企业数据和9000多万户个体工商户的数据,这些数据我们来源是60个部委,也就是政府公开的信息。这些政府公开的信息,我们在这里称为非银行信息,将人民银行征信系统采集的信用信息结合起来,即可以为金融服务。非银行数据采集以后,我们就建了企业信用行为数据库,为我们银行金融服务,政府监管服务。我们中国企业基本是二八定力,即75%的中小企业获得25%的贷款,25%的大型企业可获得75%的贷款,特别是新经济体制下的轻资产的企业,如何获得金融服务,也就是说,因为中国的企业不同于发达国家的企业,发达国家因为金融市场很发达,而中国的企业获得银行普惠金融能力很弱,所以金融不能用发达国家信用体系来衡量中国企业信用。所以衡量中国中小企业以及新经济这类轻资产的企业,必须是将银行的信用数据和非银行的信用数据,综合起来衡量中国企业的信用行为。

  我曾经在人民银行工作三十多年,从1996年起参与中国的征信系统建设,去年加入BBD公司,因此我深刻地体会。中国的企业更多信用信息是散落在非银行各行各业,因此这点是我们公司在这方面逐力打造,作为人民银行提供的企业信用信息补充。因此,我们公司获得了企业的征信牌照。

  我们收集了60个部委的向社会公开的数据,因为我们是国家发改委社会信息体系建设联合奖惩的合作单位,因为我们的数据全量向国家发改委提供,实现了互联互通、共享政府公开的数据。我们知道国家发改委是社会金融体系建设的牵头部门,他们建立了“信用中国”平台和“全国性信用信息共享平台”,现有数据量已经达到134亿条。

  我们将政府公开信息分为八大类,现在我们除了从国家发改委平台共享信息以外,我们还有自己的数据,大家知道司法的数据,可能在座的都是同行,采集裁判文书的信息,除了采集裁判文书的信息,我们还采集了开庭公告。这个开庭公告的信息,我想在发达国家也是采的,所以国内我们是全国唯一采集362个法庭开庭公告信息,我们都是实时抓取,实时更新。

  另外还有一些招标采购的信息以及一些行业的信用信息,是我们的数据特点。目前这些数据采过来,在我们库里面已经达到7亿条数据,这个数据拿来以后,我们应用图计算的方式,这种图计算就是点和边的关系,一个节点是一个企业,边上是所有企业的属性,这种图计算的方式,让我们快速实时抓取企业信用风险以及预警。

  刚才开场说了,首先是为金融服务的,因为征信的本质就是为银行服务,这是征信的本质。为银行解决信息不对称的问题,为银行提供风控数据支撑。因此我们的征信产品有两大类:一类是金融产品,一类是征信产品。征信产品和金融产品的区别:征信产品是基础,金融产品在征信产品基础上是做的策略和应用。

  我们实现的方式是讲三块数据融合,第一个融合是政府的数据、银行的数据和我们BDB的数据进行整合。整合了以后建立五个模型,一个准入模型,为金融机构提供白名单。第二我们做预警模型,贷中、贷后提供预警。第三信用行为评分模型。第四就是我们做决策模型,这个决策模型是为客户提供放款额度和定价。最后就是做贷后预警模型。这些是三个数据、五个模型的应用,因此行业应用方面以及产品的场景应用方面,我们已经通过两年的运行,一年这方面的收入就是几千万。

  作为大数据的解决方案,有六个核心要素,因为中小企业,特别是中国的中小企业和国际上不同,它扩散的能力特别强,投资的风险、担保圈的扩散,因此做中小企业风控解决信息不对称问题,很重要一点就是企业画像。我们在企业画像这个基础上我们运用了本体理论,把一个企业从历史,所有信用行为拉平,进行动态、穿透式的评估,动态地对企业风险进行全面基因式的画像。

  第二就是数据集市。我们做大数据信用,为金融机构提供服务,为金融监管提供服务,通过数据挖掘形成中间变量,这些变量通过机构学习方法计算而得。我们建立一个5000多个反映企业信用行为特征的变量库,这一点在美国三大征信局得到了广泛的应用,现在国内市场上,我们公司的企业信用信息的变量库,也为商业银行提供了定制化的风控服务。

  第三点就是可视化。可视化我们通过实时在线业务监控,和风险指标进行在线实际展示。

  第四就是云服务,我们同行大家都在利用这个技术,就不详细说。

  第五我们就是建立模型。模型不光在风控上,同时我们还建立对模型本身实施稳定性、区分能力在线监控。

  第六就是我们贷后的预警。我们在这个解决方案里面,有两个难点。第一个难点就是数据治理。我们前期说是银行的数据,政府的数据以及BBD的数据,三者的数据融合起来,其实所谓的大数据就是高纬度、实时的、高频的,处理起来这些数据虽然现在技术这么发达,实际还是很难的,因为大数据首先要解决相似主体的判断技术问题,因此相似主体的技术判断,在数据治理这方面是至关重要的。我们要提供白名单,第一个环节就是要把数据治理完善,这个白名单的才能符合各家银行的要求。

  第二个难点就是我们数据质量的管控,数据质量的验证。数据质量监控上,我们对它进行完整性、一致性、有效性和时效性,这一点因为时间关系就不展开了。

  在为商业银行提供金融解决方案中,第一提供白名单。第二提供贷后监管服务。白名单我们是通过准入模型和我们的信用行为评分模型这两个结合起来,做授信、定价。在风控里面,我们做了全息式、模块化、可扩展的标准化产品。因此,我们很快在现场进行组合、安装、验证。

  我们整个大数据金融风控解决方案,就是动态、穿透进行,因为中国特别是微型的企业,它更重要是业主个人信用行为对企业影响比较大。因此,往往企业信用出现风险是因为个人信用出了问题,所以我们整个风控方案里面做穿透式管理,实现从准入校验到模型校验,从个人信用行为到企业信用行为进行穿透式评价。

  比如我们信用行为评分,我们用传统逻辑分配,在准入模型这方面,特别是企业画像里面,我们是用上述展示的机器学习的方法,这个学习方法里,我们怎么寻找风险传导路线,包括我们四大商银行,家家都有企业画像,但没有实现。

  这4年我们解决了动态的、静态的风险传导网络问题。第一是在企业画像基础上,我们用了一些机器学习的方法,对风险关键路径网络重构,对关系网络结构风险进行评分,对核心风险主体进行分析,形成时空关联网络衍变和关键网络路径搜索。通过计算学习的方法,把所有的点和面进行链路的计算方法,这样形成风险传导的网络图。

  这个风险传导的网络图形成以后,我们能够很清晰展示企业画像上,展示出风险路径怎么传导的,那些企业是最危险的人。建模的方法,这个就不详细,因为时间的关系。

  大数据信用贷款在重庆银行2016年7月26日上线的,采取这种风控模式,已经放了贷款超过十个亿,现在不良率是千分之二,通过一年半的验证。另外,除了为商业银行做场景服务,还做了的供应链融资,我们供应链融资也是三方信息进行融合,实现了实时监控的智能平台。

  我们核对技术是建立了O3的数据工厂,这个数据工厂对数据实时抓取,实时入库,当客户提出要求时,我们从抓取到加工、反馈结果是秒级的反应。第三我们有机器学习的知识库。

  我们公司的技术也和美国顶级公司各个参数进行了比较,我们在数量级上、批处理技术、分析平台上,应该说已经超过了美国顶尖公司。另外,我们的团队在冲击Nature,用力学原理解决企业信用风险的扩散。谢谢大家。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

责任编辑:谢长杉

  《财经会议》报道你看不见的会场实况,传播会议精华内容,会议直播提前预告,不定期送出免费超值会议门票。官方微博:财经会议,微信号:caijinghy。扫码更方便。

财经会议

热门推荐

相关阅读

0