2016年12月17日00:41 中国经营报

  洋钱罐耿博:大数据提升风险定价效率和精准度

  罗辑

  12月13日,凭借充分发扬技术特长,深挖大数据并推进机器学习技术以提高金融机构风险防控能力上所做的贡献,洋钱罐在“2016(十四届)中国企业竞争力年会金融高峰论坛”上斩获“2016卓越竞争力科技金融机构”奖项。

  作为前微软美国资深架构师、现任洋钱罐CTO的耿博,凭借其资深的大数据处理、机器学习及其在互联网金融板块的应用经验,在论坛上向《中国经营报》记者分享了“金融创新2.0”时代下,从风险控制到画像营销,金融如何结合地位正在日益凸显的数据技术,把握住行业变革来临时的市场脉搏。

  算法“加持”反欺诈

  野蛮生长时代的过去伴随着监管风暴,进一步将金融市场的核心——风险控制提升到前所未有的高度,而如何提高机构风控能力?

  作为以数据、技术优势占据互联网金融中高端市场的洋钱罐,其CTO耿博提及,洋钱罐主要是面对C端零散的白领客户理财和小额短期客户借贷需求进行高效撮合,解决两类用户的金融需求,“从技术的角度看,C端客户的风控主要分为两个部分, 一是还款意愿的评估,二是还款能力的评估。”

  耿博告诉记者,“洋钱罐为了满足理财用户灵活安全的理财需求,债权集中投资于小额短期的消费类。对于这类债权,核心问题集中在还款意愿的评估上,其实就是检测欺诈用户。反欺诈本身又分为个体欺诈和群体欺诈。个体欺诈属于经典的基于互联网大数据和有监督/半监督的机器学习技术去解决的问题,随着数据量不断积累,发掘的互联网变量逐步增多,可以持续迭代不断优化。群体欺诈则更加侧重于基于各种用户信息生成画像,然后对不同用户画像基于相似度进行聚类,这属于机器学习中的无监督学习范畴,度量学习以及聚类算法在这里起着至关重要的作用。另外,每日都会有大量的用户存在还款和逾期状态的更新。这些状态更新如果能够高效反馈到模型并更新模型的参数,当用户人群发生迁移或者欺诈行为发生变化时便能动态地进行适应。这里在线学习和迁移学习将发挥很大的价值。”

  在上述论坛的圆桌会议上,耿博坦言,基于这样的算法,“在我们平台上基本上可以没有群体性欺诈,很少有个体欺诈。”

  数据能力掌握“定价权”

  可以看到,互联网金融的风控中,大数据和机器学习技术起着至关重要的作用。实际上,金融脱离不了数据,大数据时代的到来则正在冲击金融格局,例如不少握有数据资料的互联网公司入局洗牌。从洋钱罐的发展来看,数据的获取、处理技术是何种地位?如何对公司持久发展起到助力作用?

  “数据的获取和处理技术,在未来是洋钱罐发展的重中之重。本质上来讲,互联网金融企业的核心就是利用大量的网络数据变量,对传统金融无法触及的用户进行风险定价并提供金融服务。”耿博坦言,金融本身即风险与收益的双重判断,在此逻辑下,新生的互联网金融机构优势正在于拥有海量的数据源、高效的数据处理技术,对更为庞大的新增用户群体给予更为精准的风险定价,“数据的获取方式和处理能力决定了企业对于风险定价的精准度和覆盖率。洋钱罐通过自主研发的数据获取流程,结合线上数十家数据合作方,通过纯线上的方式抽取了数千维度的变量。基于这些变量,针对诚信、失联、关联聚类、信用等多个维度构建了若干个机器学习模型,精确判别用户的欺诈和信用风险等级。”

  技术出身的耿博也对未来互联网、数据科技在金融业中起到的“变量作用”畅言,“未来互联网科技和数据处理技术在金融业中有广阔的应用空间,目前相较更为确定的主要包括三个方面。一是人工智能,尤其是深度学习技术的革新,对于传统金融以及当前基于机器学习的风控会带来新的机会。用户各方面零散的互联网数据会形成一个高维度的向量空间,在此基础上利用深度神经网络进行学习优化,对零散的互联网底层特征自动编码,寻找到风控问题中最重要的特征信息,进而生成高级的特征表示及决策模型。在数据量足够充分的前提下,深度学习算法对于互联网金融的风控能够带来全新的机会。”

  “二是大数据处理技术,面对互联网结构化、半结构化和非结构化的海量数据,需要开发高效可靠的数据抓取,高效准确的数据清洗和结构化提取架构,分布式的大规模的存储和索引系统,有针对性地设计机器学习线下训练以及线上预测模型,都为之前提到的风控提供了相应的技术基础。三则是数据隐私以及安全性,由于互联网风控数据带有大量的用户授权后获取的隐私数据,如何保证海量数据在存储过程中安全加密,在数据分析过程中有效脱敏,也是非常关键的环节。”

  在金融创新的浪潮下,互联网、数据技术宛如方舟,变革正在发生,只有前瞻的掌舵者才能踏入时代奔腾的河流。

责任编辑:周宇航

下载新浪财经app,赢iphone7
下载新浪财经app,赢iphone7

相关阅读

0