陆杰讯介绍PayPal风险控制体系

2013年10月24日 17:15  新浪财经 微博
“硅谷对话北京——2013互联网金融创新峰会”于10月24日在北京召开。上图为PayPal Global Head 陆杰讯。(图片来源:新浪财经 梁斌 摄)   “硅谷对话北京——2013互联网金融创新峰会”于10月24日在北京召开。上图为PayPal Global Head 陆杰讯。(图片来源:新浪财经 梁斌 摄)

  新浪财经讯 “硅谷对话北京——2013互联网金融创新峰会”于10月24日在北京召开。上图为PayPal Global Head 陆杰讯。

  以下为演讲实录:

  陆杰讯:(短片)这个短片讲PayPal在创新领域做的工作,这不是天方夜谭,如果在我加入PayPal五年前,大家给我看这个短片,我会说是天方夜谭,但现在所有这些案例都在美国欧洲市场大规模的实施了,所以我刚才跟唐总场下交流的时候说,明年再开会就叫互联金融创新峰会了,不再需要“网”这个字了,不需要手机,不需要任何其它装置。只要知道你的手机号和你密码就可以去买东西,所以为什么互联网的创新和大数据的提供这些机会,能让PayPal实现这些新的业务模式,是因为我们风险引擎。

  风险引擎不光在在线数据,在线管控,现在线上交易和线下交易,互联网和移动网交易,具体电商交易和非电商交易模糊了。线上交易还是线下交易,两种交易的融合。

  当你问题变到100多个国家20多种货币,你的问题就放大很多很多倍,所以从业务范围来讲是很大问题,因为不是一个单一币种,单一国家的问题,是世界性的问题,24小时不停顿的问题,所以业务上和技术上也是很大的问题。处理信息量,处理事件,处理数据是海量的,大家可以看到这些数据。每天上亿的实时事件,每天上十亿,对系统风险评估反应时间要求是要在半秒钟左右,精确度也要求很高,而且现在看到季报,我们基本上每年年度增长率,从支付交易量增长率接近30%,从系统整个平台处理信息能力,能够做出风险评估能力要求也非常高。

  作为风控很多误区就是觉得风控就是要把金融损失降到最低这是一个希望要求,还有一个要求就说不要把好的客户判断成坏的客户,好的交易判断成坏的交易。对整个风险引擎精确度要求非常高,精确度要求高产生一个问题,产生一个矛盾,精确高几个嘉宾讨论的更加多数据量才能做到更精确。但是更多数据量产生问题,我对系统要求更高,数据量抓取访问时间越长本身是矛盾,精确要做数据时间长,我要做判断要快这又是矛盾怎么解决这个矛盾。

  当然这不是数据模型只是解释一个概念,我想把风控行业讲的比较简单易懂,评估一个风险,把风险分化实施风险,在坐在这儿之前昨天你的风险是什么,昨天的昨天你的风险是什么?地震房子倒下来我们都死掉是实时风险,风险发现以前24小时发现风险,对风险评估不会改变。假设你信息是准确的,你的风险评估现在做这个评估,还是24小时以前做这个评估结果应该是一样的。

  所以通过这个方法你可以把这个问题分离开,从系统角度来解决不同的问题不同的方式。但是还有另外一个比较复杂问题就是说,我们刚才讲用户图象分析,配套自己的实践,做用户级别分析很重要,还有其它级别分析,访问渠道图象分析。比如说互联网网络浏览器访问风险和用手机访问风险,和具体到一个商店,本人在那里买东西风险不一样,所以要做这个不同访问渠道图象分析。

  当然比较传统的帐户、交易大家在网上虚拟世界诸位有很多不同网上ID,可能每个人都有5到10、20都有可能,不管网上虚拟ID,自然实体只有一个。所以怎么把这方面图象分析做得好,像我们跟雅虎有合作两年前,把雅虎数据和我们PayPal数据做共享发现非常惊奇事情,通过数像分析,交易数据,从谁谁打钱,收钱都是,每个人隔六个人大家都认识,某种方式都是都有交易消息,大家都是连通,所以在社交行为方面来讲,你的社交人群和你的在金融方面这些行为都是有相关性,所以把这些东西打包起来做综合分析,不能只做我们个人实践,不能只能用户图象分析,把四五层次图象分析,不同层次都要做好所有结论融合起来,信息量又在海量增加,但对风险评估时间的要求没有改变,还是半秒钟。

  分享一下技术平台方面怎么解决?这是一个比较高层次图,主要的风险评估引擎模块解释比较清楚。

  基本上看上面的架构是属于在线信息,刚才嘉宾讲到复杂事件处理平台。我们每天上亿数量采集时时事件,通过这个平台处理。我们也是利用开放原码,复杂事件处理,模型开发人员来使用这些数据,数据里面产生价值信息又做二次开发,把一些有比较,没有编成技能研发人员或者分析人员,可以用我们截面来进行模型和变量开发,这是通过二次开发,给用户比较好的开发环境。

  下半部分属于我们离线分析系统,两个系统衔接很重要,就说你在实时采集的数据也要通过某种方式传输到你的离线系统,离线系统计算参数变量信息反馈到实时系统,完全循环一个体系,技术上挑战还是很大的。具体系统我们用什么具体技术不能透露,属于企业核心竞争力,一点可以告诉大家砸钱。大家猜一猜这个系统花多少钱,我才来四年半时间估计2亿美金,但是2亿美金投进去做40%-60%没有做完。

  下面给大家讲两个具体案例,通过CEP概念把时时事件抓过来,我们有一个案件,有一个信用卡犯罪集团他们很聪明,通过犯罪分子黑网去买用户信用卡信息,把信用卡信息买来以后,50张、100张信用卡,立刻开通新的PayPal帐户,他们再去换另外一张卡,他先拿一张卡开10个帐号,把这个卡刷50块,放到第二个帐号再花50块,发生这个操作很长时间。这通过传统离线处理方式来不及,抓住他卡刷光,用复杂处理信号,用PayPal这种变量,各种技术手段建立这种模式,通过这种模式很快实施探测到,来制止这种其它行为。

  另外利用大数据用离线,这是做商家网站这是在中国一个网站,商家建立帐户时候说卖洗发水、清洁剂,相信它说的把它所充实商品的种类就是作为使用化学用品,把这个参数输入到你的风险模型里得出结论和真正做的事情是不一样的。但是有成千上万网站,现在修改网站产生新网站成本很低,不可能用人工办法盯着网站,所以我们用大数据用离线分析,在24小时之内就来改网站人很少见,可能每天在改,每星期、每月改有可能,24小时改没有意思,搜索引擎不能察觉到它这种更改,所以我们用离线大数据的办法做发掘。发现很有意思情况,现在做日用化学品的,没有告诉我具体网站详细信息页也是空页,通过我们文本分析以后可以看到,我们进行文本挖掘网站索的网页都有一些在右边。

  做的LG跟其它相关网站比较,跟其它日用品网站不搭,它这些都是做在线游戏一些东西,所以我们觉得通过文本开发大数据得出结论合乎,真实的卖的商品实际上是游戏,是虚拟游戏这种商品,这样我们在把更请确的参数输入到我们风险引擎,对商家风险评估更加准确了。刚才嘉宾讨论到,你在大数据没法定义什么是最好的,只是看到具体案例时候,把你在线数据和离线数据各种分析办法完全综合起来才会发现比较好结果,这是我今天演讲。

分享到:
保存  |  打印  |  关闭
猜你喜欢

看过本文的人还看过

  • 新闻季建业长期被传双规 港媒曝其多位情人
  • 体育欧冠C罗2球皇马2-1尤文 伊布4球 曼联胜
  • 娱乐章子怡携汪峰为长辈贺寿 恋情再添铁证
  • 财经日本明治奶粉暂时撤出中国 称利益难提升
  • 科技来往秘邀大V测试 公众账号即将全面开放
  • 博客美国华人:“杀光中国人”节目让人生气
  • 读书枉担恶名:李莲英为人低调为何还挨骂
  • 教育奶茶MM纽约读名校演绎白富美人生(图)
  • 张捷:新快报头版请放人滥用媒体权利
  • 陈虎:房地产京7条突然出笼有何深意
  • 徐斌:那些不作死不会死的土豪们
  • 叶檀:北京自住型商品房估计不好卖
  • 周彦武:远超08年的金融危机明年爆发
  • 花木兰:美国将出现金融混乱
  • 钮文新:美国的失业率到底有多高
  • 王吉舟:湖南警方跨省抓记者大戏解码
  • 刘石:从央视乱批星巴克看定价误区
  • 张明:中国应如何多元化外汇储备