郑茂林:P2P想做大 不能光靠人审批

2015年01月09日 17:34  新浪财经 微博 收藏本文     
“金融极客汇”第二期——“信用的无限畅想”沙龙于2014年12月5日在上海举行。上图为宜信公司首席科学家郑茂林。(图片来源:新浪财经)   “金融极客汇”第二期——“信用的无限畅想”沙龙于2014年12月5日在上海举行。上图为宜信公司首席科学家郑茂林。(图片来源:新浪财经)

  新浪财经讯 “金融极客汇”第二期——“信用的无限畅想”沙龙于2014年12月5日在上海举行。上图为宜信公司首席科学家郑茂林。

  以下为演讲实录:

  郑茂林:我现在在宜信主要做跟征信有关系的,我们是在企业征信跟个人征信,因为这对于宜信本身和互联网金融来说是更有意思的。下面我也会提到评分,但是我们是在做评分,所以也收集一些数据。我自己弄了几张PPT,可能写的比较粗一点。如果你们有什么问题,大家可以随时问,我尽我的力量回答。今天是“畅想”,可是我的年龄这么大,也没有什么畅想,就讲到哪里是哪里。

  要点:征信数据、信用评分模型、信用评分、主要应用领域和效果。

  其实我跟周总讲的技术方面,可能会有一些重叠或者说是他演讲的补充。P2P虽然风险很大,但是如果手段可以,还是可以控制的。这个征信数据,刚刚周总也提到了,我们关心的,我这个依据的还是在美国的,和这边可能还是有一点距离。一般在FICO评分的时候涵盖的数据,一个是银行。实际上FICO Score评分,背后有一个数据,有一个Model Builder,实际上是各个银行、各个信用卡公司会给他这个平台自动提供信息,所以才会有了FICO Score。FICO Score反过来,又赚别人的钱,所以这是很有意思的事情。

  再一个就是消费,消费应该是指信用卡的消费,因为在美国要买东西一般刷卡的居多。还有一些金融公司,个人收入也算是。个人收入一般应该反映在你贷款的一定会要你过去两个月或者三个月的工资条,这是这个。房产,一般美国的消费是买房子、买车,这是两个,因为消费金融一般都是用信用卡,不像咱现在有个像京东的白条。信用卡在中国有中国的特点。资产,资产就多了,比如:我贷款买房子。我虽然原来没有房子,但是我有多少股票,这是我的资产。再一个是债务,你原来欠的信用卡的钱,或者房产,美国的房子都要交房产税的,咱这儿还没有交,不过以后可能要交,还有房贷,还有一些基础信息。FICO Score涵盖的信息,基本上是从这边来的一些信息。

  即便在美国也会补充一些数据,有些评分,有些公司自己的评分都会把自己的一些数据加进去,除了FICO Score之外。一般通讯来自于你打电话付款的信息,还有你的租赁。租赁在美国一般就是租房子,租房子一般专门有这种报告的公司。如果你贷款的话,他可以把你过去租房子的这些都可以查出来。比如:我把我的名字,把我的社保号放进去的话,可以看到我读书时候的信息都会保存下来。有专门收集这些信息的公司。还有短期信贷,美国很多上顿不接下顿的还有很多。很多星期五发了支票工资,然后就去你把支票给他,他把钱给你,但是要扣一些手续费,那个手续费是相当高的。那些客户连信用记录啥都没有的,这种就要用其它的,当然这种风险也是比较高的。

  还有互联网信贷,我认为这也是很重要的。再一个身份认证,可能是一个需要做的事情。在这里我刻意没有说“社交数据”,互联网思维会把社交数据加进去,其实社交数据应该是比较不可靠的数据。这里你们看这些数据有一个特点,这些数据是关于你的数据,但是不是你自己给自己造的数据,所以这些数据都是比较客观的一些数据。互联网的社交数据,会不会有效果?其实在美国现在银行界对于社交数据断定信用,还有一段距离,至于后面有什么样的模型?这可能有用,但是我感到要把这个真正用在风险信用上,还是要有一段路要走。

  我们现在在宜信也在专注于收集一些数据,因为要贷款没有数据,没有判断风险,一般肉包子打狗,咱就出不来了,尤其是在中国这个信用环境。我也不说人不厚道,但是相对来说这种互联网P2P欺诈的风险要比美国社会可能要高许多。

  如果实在没有这些数据,我们可以用一些社交数据也可以取代一些东西。能用什么数据我们就用什么数据,然后根据这个来做一些工作,基本上是这个原则。并不是说,咱们没有这些,咱就不做了。这是大概的数据,我这里有提到这些现在做征信比较关注的数据。在中国数据的分享还有一段距离,我是09年年底回来,是被他们忽悠回来说要做中国的征信。我说,这个好啊,多少我知道一点,我们做吧。回来以后发现,不是那么简单的事情,我们有很长的路要走。这个我是深有体会,不过现在我还没有放弃,至少我还希望能够和大家一块儿努力。我希望能够看到这些东西,能够在中国;我相信在美国有用,在中国应该也会有用。

  FICO产品比较成功的是神经网络,原来这家公司就靠那个产品成长起来,后来是在2003年FICO把这家合并到现在的FICO。开始占领美国市场70%多,现在我不知道多少。这边我们经常听到的朴素贝叶斯模型,这些都是所谓的事后推断。实际上朴素贝叶斯模型是一个组合模型。FICO Score背后的模型实际上是它自己独家的秘笈,完全是它自己的一套模型。我这里想说一点,FICO评分在美国是事实上的标准,虽然说供大家所别人的标准,其实所有的银行都用的你要贷款必须要FICO Score。最后我会提到和三家信用公司,他们也有一个评分,这还一直在打。

  现在基本上互联网、大数据用的都是各个模型组合在一起,有什么就拿来,最后算出一个东西。

  (PPT) 这FICO Score包含的这些主要的权重,在这几个方面。我下面要提到的是Vantage Score,Vantage Score是直接和FICO Score集中的。这个Score的背后,根据我的推测和我曾经和他们造评分的在这个团队里的一个人聊,它应该有一部分用的是逻辑回归的模型在里面。他们有一些比较奇怪的现象,因为逻辑回归这个模型也是我们数学家通常想出来的。

  但是这个逻辑回归做不好的话,它的稳定性就会相对的;本来我们做评分,实际上你想一想我们做评分,我们要预测未来,我们用的数据是过去的,但是我们使用的数据是未来的,所以这里面也有一个危险,这从逻辑上不是很通的。你在拿一个过去的东西硬往上套,这个时候如果模型不好,可能看起来很准,结果突然就像由于数据的变化或者信息的变化,一下子跌到沟里都有可能。这些数据的模型,各个模型都分好,都有它的道理,但是并不见得你做的这个卡就一定非常稳定。FICO Score是一个非常稳定的,所以当Vantage Score要取代这些,到目前还没有取代掉很简单,因为FICO Score是标准。银行要把FICO Score拿掉把这个Score带上去,他们要测算多长时间呀?但是现在Vantage Score和FICO Score评分弄的是一样,意思一样不一样我不知道,但是至少它们现在表现是一样。我这是说一下Vantage Score背后,他们打过官司,打打就不打了。所以现在大概是大概就这个样子,Vantage Score大概占领5-7%的市场。这是两个我们的数学模型用的非常成功的,最后这些数学家们是可以帮助公司赚钱的,这是一个非常好的例子。

  这里评分卡这个我就专门提这两个。其实我们中国的银行每家银行都有自己的评分模型,很遗憾的事情,是他没有一个大家比较的东西。本来我们央行[微博]征信中心应该起到这个作用,但是到目前为止我还没有见到他们能够做出非常好的,公信力比较好的东西。

  主要应用领域大家也知道:金融信贷、信用卡、保险业,还有Employment、婚恋。征信市场:美国30-40亿美金;中国:很小,还是起步阶段。我感到我们中国市场很大,这个时清海有很多工作可做。

  应用效果:1.公平、效率、成效。这个一定是没的说的。像宜信现在线下做的还是很多,都是人在批。“人”实际上是最不牢靠的一个事。2.我举几个例子。美国中小企业信贷,如果没有评分没有FICO Score或者没有他们自己的评分,一般做一个贷款是要500-1000这样的成本。如果用这个可以降到100块钱以下一个。如果使用评分84%的汽车贷款一个小时完成,美国你要去买车,看好了要去买,半天就搞定,连看车带那个,拿到信贷是最容易的一件事情,它就是得益于信用评估。23%的信用贷款只需要10分钟。可见评分用的这个效果是比较厉害的。评分是什么意思?评分实际上就是把人的经验变成机器能够来做,其实就是自动化的一个不同。这几个数字是真正实实在在的是在美国市场的数字,你大概可以看到这个效果。

  这是我们国内的一个P2P,这家公司你可以看到,上面红的是它的拒绝的,就是来的这些审批的这些;那个黄色的是通过的,最后最底下还有一点,那就是坏帐。用的这个审批,评分卡是自动化程度达到70%。我下面再给你看一张这个图,这个底下是评分,上面是分布给你看了一下。其实评分相对高的坏帐率,实际上是相对减少的。为什么低分的,怎么还那么高呢?因为低分是他们想着不给他批,所以他们硬往上批。所以你要如果按照540分往上批,风险还是控制很好,这个风险在3-5%之间。我认为这个,如果P2P想做大,光靠人来审批,到最后可能人的成本就会把你这个平台利润占据太大一块。像现在很多大平台都在大成本,大人力,投掷人,砸很多钱,最后还是要回归赚钱。我举这个例子,让你感觉到,我们做这个模型是有效果的,实际上是可以帮助我们公司来赚钱,来把一些事情做的比较有成效。

  我这里顺便再提倡一句,FICO这个模型,因为我是做技术的,我对FICO后面的数学模型,那个模型评分这个我认为,我感觉从一个数学家的角度来讲,它里面还是有很多有道理的事情。虽然我也证明不了,只有在我讲的分布是“正态分布”的情况。假定来贷款的这些是正态分布,违约率这些都可以做出理论分布;假如不是正态分布,这个模型也有效,但是从逻辑上你把他证明出来写成定理,这个是比较难。大概就是这样的情况,我后面给大家说一下FICO背后为什么有一些比较有效的,它是有一些理论支持的,它要比逻辑回归的能够在Leo Breiman要证明的要强。但是任何数据算法,决策数也好,逻辑数也好,这些都有效。最后如果大家个人的功力比较好,可能做的模型都能够殊途同归,都能够达到一定的预测能力。这一点我是非常相信的,只不过有些模型好用,有些模型做起来比较难一点。同样的FICO这个模型使用起来比较容易,但是他们需要很多钱,需要很多技术。

  我就说到这里!一看我就是做数学的,所以形容词掌握不了太多。

  《财经会议》报道你看不见的会场实况,传播会议精华内容,会议直播提前预告,不定期送出免费超值会议门票。官方微博:财经会议,微信号:caijinghy。扫码更方便。

财经会议

文章关键词: 金融极客汇信用数据平台新金融联盟

相关专题

分享到:
收藏  |  保存  |  打印  |  关闭

已收藏!

您可通过新浪首页(www.sina.com.cn)顶部 “我的收藏”, 查看所有收藏过的文章。

知道了

0
猜你喜欢

看过本文的人还看过

收藏成功 查看我的收藏
  • 新闻沪黄浦区官员踩踏事发当晚在外滩吃大餐
  • 体育NBA-詹皇33分骑士6连败 科比12+7+6湖人负
  • 娱乐捂媚娘?49岁周海媚片场照胸还在(图)
  • 财经新电改方案将落地 平均电价或先降后升
  • 科技铁通被曝系统漏洞可致信息泄露
  • 博客现场专家评审:《我是歌手》节目真相
  • 读书优劣悬殊:抗美援朝敌我装备差距有多大
  • 教育00后女生失恋告白:不要我 就剪发当尼姑
  • 洪榕:2015年大盘股小盘股齐步走
  • 钮文新:央行失控的情况已经显露
  • 肖磊:人民币正遭遇三面夹击
  • 齐俊杰:选P2P先看他队友是神还是猪
  • 如松:俄罗斯已经濒临国家破产的程序
  • 花木兰:房产离地狱又走近了一步
  • 管清友:货币政策最终会走向宽松
  • 叶檀:国资证券化是共赢还是掠夺
  • 朱大鸣:2015年楼市将现疯狂与崩溃
  • 连平:当前有必要下调存款准备金率