潘瑾健:人工智能工具会发生很大变革

潘瑾健:人工智能工具会发生很大变革
2014年06月19日 11:40 新浪财经

股市瞬息万变,投资难以决策?来#A股参谋部#超话聊一聊,[点击进入]

由零壹财经和金融博物馆联合主办的“中国互联网金融论坛”于2014年6月19日在北京举行。本届论坛主题:互联网金融新契机:规范与融合。图为零壹数据负责人潘瑾健。(图片来源:新浪财经 刘海伟 摄)   由零壹财经和金融博物馆联合主办的“中国互联网金融论坛”于2014年6月19日在北京举行。本届论坛主题:互联网金融新契机:规范与融合。图为零壹数据负责人潘瑾健。(图片来源:新浪财经 刘海伟 摄)

  新浪财经讯 由零壹财经和金融博物馆联合主办的“中国互联网金融论坛”于2014年6月19日在北京举行。本届论坛主题:互联网金融新契机:规范与融合。零壹数据负责人潘瑾健在发言时表示,我相信人工智能以及超越普通意义的工具会发生很大变革,我们会给投资人提供很好的决策工具。

  以下是文字实录:

  潘瑾健:首先欢迎大家来到本次发布会。今天我也十分高兴能够在这里发布这个平台。在做这个发布会的时候,前几天,我专门翻出了两年以前一个创意大赛的PPT,这是我们当时做的三个模式图,大家看这个图的配色,也可以看出这是我两三年前的欣赏水平,色调是比较夸张的,但它的很多思想延续下来了,基本上可以完整化、体系化。

  这个Saas平台会向各个P2P借贷行业收集数据,在Saas平台上进行整合,生成统计分析的产品,我们也会给投资人提供咨询服务和数据服务。

  在原来的基础上,我们拓展了三个方面,第一个是C端的普通投资人。第二是B端,是研究机构、风险投资机构、行业机构。另外一端是政府相关部门。数据获取的方法是一致的,比如从P2P借贷平台获取数据,但它的范畴发生了变化,我们会有众筹平台的数据或者是对其他互联网金融领域进行拓展,比如货币、理财平台。

  我们这些年来一直专注于三个问题。第一个问题就是爬虫。在2011年,我是以投资人的角色进入行业,我想了解机构数据是十分难的,当时我想了一个简单的办法,我需要了解这些数据,怎么办呢?我当时就安排了一些朋友手工的去爬取数据,被我们称为人肉爬虫。后来发现这个交易平台的数据越来越多,我们一个朋友就找到我说不能再跟着我干了,我说为什么呢?他说我现在的眼镜已经400多度了,再跟着你干,我怕眼睛会瞎掉。所以我们对平台进行了升级,2012年开发了一个原始版本的爬虫。开发技术人员在原始代码阶段有大量工作,而普通人是用不到这个工具的。在2013年,尤其是10月份出现倒闭潮,问题平台达到70多家,这个爬虫已经远远不能满足需求,当时我们改变了思路,从多人对一个爬虫变成了多人对多爬虫,也就是所谓云的概念。

  我们的爬虫是一个具体的应用案例,搜索引擎是广义上的爬虫,但它有一个缺点,就是搜出来的内容乱七八糟。聚焦爬虫可以很好地解决这个问题,让用户更精准地获得这些信息。现在我们的爬虫可以多对多,即使一个爬虫瘫痪了,另外一个服务器上的爬虫还可以继续运转,普通的工作人员也可以介入到数据采集过程中,所以我们才能从一个P2P行业跳到众筹行业,我们也已经具备了这样的能力,现在已经成为一家数据采集公司。

  第二件事情就是我们专注于数据处理过程。现在白皮书上列出的样本有很多,对于他们的计算方法是不同的,比如有的平台的还款方式是按月还本还息,有的是到期还本每月付息,有的是按季度还款,有的是按天还款。我们的工作就是弄清每个平台的计算方式,才能进行统计分析。

  第二是正确性的保证。我们原来的数据团队主要是从事化工行业,我个人也是这个专业,我们对数据拥有专业的天然性敏感,如果化工行业的数据不认真基本就是拿自己的小命开玩笑。我和我的合作伙伴每天只是做一件事情,就是相互争执数据的正确和错误,这使我们建立了信心,数据库中上十亿行的样本数据,就是通过人工,用Excel,也许是一件很傻的事情,就是因为这个过程,让我们对数据拥有一种敬畏,让我们有一种自信,不管是面对机构,还是面对科研团体,还是面对政府相关部门,我们有这种自信,能够保证数据的正确性。

  第三个是产品形态的问题。

  在解决了这三个问题以后,我们也尝试着输出了一些东西,在今年亚洲博鳌金融论坛上发布的《互联网金融报告2014》,里面的众筹数据和P2P借贷数据全部都是由我们提供的。

  在科研机构合作方面,我们跟人民大学展开了P2P行业行为预测的工作。还有跟西南政法大学进行P2P犯罪预防的课题。

  在一年前,我们的数据是这样,类似于健康报告。它有一个很大的问题,就是迭代周期特别慢,以一个季度或者是一年为周期。我们花了很大的时间,但产品输出并不快,在互联网以快为胜的时代,我们以蜗牛的速度前行,竟然还能活到现在,真的是一种荣幸。

  基于以上的种种弊端,我们继续往前推进项目进展,现在我们是这个样子的。首先在数据量上,应该是达到了国内深度最大、样本最多最全的P2P数据库,也包括了众筹数据库。

  拥有了这么多的数据以后,我们的理念并没有发生改变。也许大的数据公司认为大致正确是胜于精准错误的,其实我们的观念恰恰相反。我们就是一家数据分析统计公司,我们就是提供基础数据,就要保证数据的准确性。我们跟机构核对数据的时候不会轻易改变。有原始数据的存在,数据的可追溯性也使数据是可信赖的。

  首先介绍一下指标体系。P2P行业主要由三方构成,投资人、借款人、借款平台。我很喜欢把P2P比作淘宝在平台上贩卖资金,资金是有成本的,投资人是资金的卖出方,借款人是资金的买入方,利率就是资金的价格。基于这三点,我们又提出了行业全局的观念,我会告诉大家这个月有多少新增的平台、多少倒闭的平台,这些借款人分布于全国哪些省市。

  第二个是所谓的经营性数据、运营性数据。一个平台是由成交指标构成,今天发生多少笔正常借款,利率就是价格指标。

  我们还有一个平台档案,收集的是行业资料库,大家可以下载平台发布的官方报告,以后也会有我们自己发布的报告,还有测评和各种信息结合起来。为了避免信息错误,我们还增加了纠错的功能。

  成交指标,上面是成交额,下面是成交量。同一幅图已经显示出了两个指标,比如这个上面的时间点的成交额是多少、成交量是多少。我们这个平台可以自适应手机平台。

  借款人和投资人作为参与方的属性,会有借款人的年龄、教育、婚姻状况的分布等等,在P2P借贷白皮书中的所有数据都可以在这里以技术化的形式呈现。

  我们还设置了很有意思的东西,比如有些媒体记者觉得看起来比较费劲,我们会有资料档案库,会推送一些报告,不会是以图表的形式,而是以文字的形式告诉你,这样大家接触的信息更加直观了当。我们现在的动态数据可以做到保证,复杂数据实时更新。

  关于未来,我有很多的想法,但真正的想法是什么样子的,我还不太确定,希望大家可以持续关注我们,产品也会不断更新。我们希望大家在关注我们的时候也会提出很好的建议,也会给在座的各位朋友提供一些VIP账号,如果有兴趣可以参与到我们的测试中来。

  我们现在只能告诉大家这个行业发生了什么,我们希望在不远的将来能告诉你们将要发生什么。我相信人工智能以及超越普通意义的工具会发生很大变革,我们会给投资人提供很好的决策工具。

  最后感谢大家来到今天的发布会,感谢零壹数据全体开发部人员和数据部成员。

 

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

7X24小时

  • 07-10 航材股份 688563 78.99
  • 07-10 苏州规划 301505 26.35
  • 07-10 智信精密 301512 39.66
  • 07-10 博盈特焊 301468 47.58
  • 07-07 精智达 688627 46.77
  • 产品入口: 新浪财经APP-股票-免费问股
    新浪首页 语音播报 相关新闻 返回顶部