张俊:没有数据量谈大数据就是在忽悠

2013年11月07日 18:31  新浪财经 微博
“第十届中国国际金融论坛”于2013年10月27-28日在上海举行。28日下午召开大数据时代的互联网金融发展及电子支付技术创新论坛。拍拍贷金融信息服务有限公司总裁张俊出席论坛并发表了自己的观点。(图片来源:新浪财经)   “第十届中国国际金融论坛”于2013年10月27-28日在上海举行。28日下午召开大数据时代的互联网金融发展及电子支付技术创新论坛。拍拍贷金融信息服务有限公司总裁张俊出席论坛并发表了自己的观点。(图片来源:新浪财经)

  新浪财经讯 “第十届中国国际金融论坛”于2013年10月27-28日在上海举行。28日下午召开大数据时代的互联网金融发展及电子支付技术创新论坛。拍拍贷金融信息服务有限公司总裁张俊出席论坛并发表了自己的观点。张俊表示,即使是千亿级别,可能刚刚占一点大数据的边。所以这个数据量是一个很重要的问题,没有这个数据量,你谈大数据的话就是在忽悠你。

  以下是演讲实录:

  【张俊】:前段时间看了一个案例,大家在说什么是大数据,其中有一个专家说有个案例很好,什么案例呢?大家都喜欢喝牛奶,养奶牛的农场主发现每个奶牛在不同的时间段产量不一样,一开始说跟挤奶工的力度有关系,挤奶工也说不清楚。挤奶的过程基本上是靠熟练工靠新人来摸索。农场主觉得心里很不踏实,对于他们来说希望这个牛奶的产量越高越好。这时候请了专家来咨询到底怎么解决这个问题。专家分析说这里面影响牛奶产量可能有些因素,比如有关生理的方面,有没有吃饱,今天的温度怎么样,湿度怎么样,等等这些问题。当然也有可能跟奶牛的心理状况有关系,今天怎么样,有没有跟邻居吵过架等等。

  后来另一个专家说这样挑1百头牛,把每天的产奶量记录下来,什么时候产的,挤奶的时候力度怎么样,把一些纬度的数据都记录下来,同时还给每个奶牛圈装上摄象头,一天24小时观察奶牛的状况,经过一个多月的观察,最后分析出来奶牛在每天的某些时间吃完东西,消化两小时以后最后得出一个结论:这时候挤奶,可能是产量最高的。最后找到了最终的解决之道。

  这是一个案例,这样引出想跟跟大家探讨的三个问题:第一,现在是不是大数据时代?从我来讲现在不是大数据时代。大数据的前提是数据量要足够大。回顾到奶牛的案例,一个奶牛厂撑死1百万奶牛足够多了吧?像1百奶牛的数据量是不够的,非常少。这样就叫大数据不是很笑话吗?

  全国有十几亿人,每个人身上有各种属性的数据。可能银行在看你个人的状况来提供额度值,有可能看1百项数据。这是千亿级别,可能刚刚占一点大数据的边。所以这个数据量是一个很重要的问题,没有这个数据量,你谈大数据的话就是在忽悠你。有的说我们公司的大数据特别牛B,要担心了。

  刚才说银行有很多大数据,银行能不能做大数据,觉得现阶段银行也做不到大数据。还是数据量,2亿用户,怎么看一个人,主要是看收入能力和个人状况,如果是白领的话,会看工资收入,缴费记录,当前的市场环境各方面加在一起不到1百个数据纬度,乘以2亿用户,就是2百亿的用户量。

  另外一方面,它的很多数据都是结构化的数据,我再看大数据的时候,一,数据量要足够多。二,要去分析非常多的非结构化数据,这是一个全量分析的概念,不是抽样分析。比如我们看一个人的一张照片,这个照片上其实隐含了很多数据,如果作为结构化数据动带的话,就是一张照片,如果当成非结构化的数据来看,这个照片里面隐含了很多信息,它当时的心理状况怎么样,周围跟他一起合营的人跟他是什么关系,在什么地方,可以出来很多数据。假设加入这些数据纬度的话,数据量就有一个集合级数的上升。我觉得银行跟大数据比较近,因为有这么多的交易记录。

  银行既然有这个数据,那为什么现在不去做呢?这里有一个思路的问题,思路决定出路,根本没有想到这个数据怎么用。好像给一个人额度的时候,看你的还款能力,衡量一个人还款能力的就是这些数据纬度,从P2P的角度来讲可能就不是这样了。

  想探讨的第三个问题:P2P是不是跟大数据结合。P2P是大数据吗?觉得现阶段还谈不上真正的大数据,但在这条路上。思路决定出路,首先要知道说这个努力的方向是哪里,怎么样来拓展我的数据纬度。还是一样回到银行受信时候,看的是个人的还款能力,这是最主要的衡量因素。

  开发贷看你的违约成本。什么叫违约成本?在座各位借给你们50万不会跑,但是放在某些人身上,他可能不会还款了。怎么看违约成本,有很多的方法,可以拓展出非常多的数据纬度。这些里面比如像现在看一个人的非结构化数据,你是一个微博用户,你有多少粉丝数,你的粉丝里面大概是一个什么样的构成,每天发多少微博,微博平均被转化多少次,一般关注谁,关注什么的样话题和热点,在腾讯微博上、QQ上、开心上、人人上,各方面的数据纬度都可以去分析、去看,最终看一个人的违约成本,给到你的受信会低于违约成本。

  一个用户的数据纬度有的可能超过3千个纬度,平均每个都有2千个纬度。我们有几千万用户的时候,拓展用户的非结构化纬度,可能就到了万亿级别的数据量,现在计算速度已经不是瓶颈,到这个阶段我相信我们在大数据会拓展出一片新的天地。届时再跟各位分享开发贷在大数据方面取得什么样的进展。我觉得这是一个非常好的时代,但我们现在正在这条路上走,而且觉得P2P最有可能,最有机会跟大数据结合,因为我们是银行的补充,我们需要采取跟银行不一样的方式,我们去服务大规模、小额度的吊丝用户,好处是积累了数据,有了创新的方法,所以有可能会成为未来真正牛B的大数据公司。

  谢谢大家!

 

分享到:
保存  |  打印  |  关闭
猜你喜欢

看过本文的人还看过

  • 新闻山西省委附近爆炸案警方锁定作案车辆
  • 体育欧冠-梅西2球巴萨3-1米兰 阿森纳胜 视频
  • 娱乐刘晓庆:隐婚1年才公开 曾拒收老公1千万
  • 财经媒体称央企员工平均年薪11万是私企3.8倍
  • 科技十大智能手表:苹果iWatch最令人期待
  • 博客黄文炜:日本人下跪是一种怪异现象
  • 读书真实版色戒:怀揣明星梦的刺客郑苹如
  • 教育教授强令女儿弃中文学金融 新浪教育盛典
  • 华生:土地制度改革六大认识误区
  • 水皮:李克强公开课究竟讲了些什么
  • 沈晓杰:孙杨是考驾照寻租链上的冤魂
  • 陶冬:房价短期会涨 中期会跌
  • 朱大鸣:三中全会房地产政策大猜想
  • 陈思进:最大海归潮冲向中国
  • 叶檀:中国无人能逃脱通胀压力
  • 商寅泉:自住型商品房前景初探
  • 周彦武:如何突破监管的存贷比红线
  • 唐钧:别忘了现行退休年龄的好处