新创代| “感谢OpenAI推动模型普及”!拓数派创始人冯雷:用大模型数据计算系统开启AI技术新范式

新创代| “感谢OpenAI推动模型普及”!拓数派创始人冯雷:用大模型数据计算系统开启AI技术新范式
2024年03月22日 14:36 媒体滚动

转自:周到上海

“我很感谢OpenAI的chatgpt引发的通用人工智能这波浪潮,大模型的起来,对我们创业公司是一个重要的助推。”

近日,拓数派创始人兼CEO冯雷(Ray Von)接受采访时说,2021年创立的拓数派,旗下的大模型数据计算系统,就是以云原生技术重构数据存储和计算,一份存储,多引擎数据计算,全面升级大数据系统至大模型时代,使得自主可控的大模型数据计算系统保持全球领先,成为AI的基础科技底座的同时,开启AI技术的新范式。

“大模型的兴起,让我们在对客户沟通拓数派的产品时,相对更容易被理解。”而对冯雷而言,“模型”是个再熟悉不过的词语,不管是从浙江物理奥赛银牌进⼊北⼤学习物理和经济,还是在卡内基梅隆⼤学(CMU)完成硕⼠学业,“物理干什么事?就是作为你的数学模型,解释地球绕着太阳怎么转,电子围绕原子核怎么转的等。”

冯雷说,人工智能大模型跟物理模型不太一样,不过卡内基梅隆⼤学是人工智能的诞生地,当年在那里读书时,他有机会听了很多图灵奖得主的课,毕业后在甲骨文工作以及后来的创业,也都一直沿着模型和数据的方向走。

“数字化经历三个阶段,第一是软件公司,比如通过星巴克APP,用户可以下单;第二个阶段是数据公司把数据存储起来,第三是数学模型公司。”冯雷认为,随着人工智能AI大模型时代的到来,数字化正进入第三个阶段。

“拓数派公司的英文名是OpenPie,2021年创立时,OpenAI还没有大火,为什么两个公司名字那么像,因为大家都和AI诞生地卡内基梅隆⼤学有很深渊源的,思维还是有点像的。”冯雷笑着调侃说。

这两年chatgpt大模型火爆,国内冒出了数百家大模型公司,2024年年初Sora的问世,也更加速了通用人工智能的历史进程。“我们想过AI大模型的发展会很快,但没想到这么快!”对于Sora的出现,冯雷认为,未来AI多模态的数据,在应用层的发展会越来越快。

“数据量的增长是非常可怕的!”阿里云资深技术专家、数据湖存储技术负责人梁明旭给出一个数据的增长曲线,个人产生的数据增速是每五年10倍,“换个说法,相当于十五年增长1000倍!”梁明旭表示,这相当于从2009年到2024年,整个数据量的增长达到1000倍。

而且随着人工智能的到来,机器产生的数据量超过个人,将达到每五年增长50倍。社会的数据量已经呈现出爆发式增长的陡峭曲线。

数据爆发增长的背后,数据的价值也在发生变化,越是实时的数据,它的价值可能越高。“随着大数据系统的发展,数据的累积就会慢慢体现数据的价值。”梁明旭说,原来数据中心是成本中心,而随着AI时代的到来,数据中心正成为企业的创新中心。

如何存储更多的数据、如何降低数据的使用和管理成本,如何提高挖掘数据价值的效率,这些都成了数据高速发展下的业务趋势。

“大模型驱动数量级数据增长,数据流转从跨系统、跨部门走向跨机构、跨行业,算力纵向扩容和横向扩容并举,这些都成为当下乃至未来企业发展创新的重大挑战。”也是基于这样的走向判断,冯雷表示,拓数派近日从结构化数据开始先行突破内核技术,正式推出云原生虚拟数仓PieCloudDB 3.0版本,“通过公司首创的数仓虚拟化技术,支撑数据要素可信流通,真正实现数据‘可用不可见’,让模型更大更快更准,并达到「数据入库不出户:不跑数据,跑计算」的安全状态。”

2022年12月,中共中央 国务院重磅发文,《关于构建数据基础制度更好发挥数据要素作用的意见》的“数据二十条”来了,中国也成为首个将数据明确为生产要素的国家。

而在当下,传统方案在数据隐私、灵活性以及大模型计算延展性等方面存在一定挑战,数据要素流通环节面临处理效率低,监管难、资源浪费等诸多问题。

拓数派原创的云原生虚拟数仓是什么?

“这相当于把元数据当作保险箱的目录和权限数据,把数据资产当做保险箱里的数据黄金,我们只需要对元数据进行交换,就可以访问保险箱里面的数据资产,把云上无感知计算当作一堆计算器,需要的时候,根据元数据目录定位和权限,拉到对应的保险箱数据进行计算。”冯雷强调:“这是云原生数据计算的本质突破。”

实际上,过去三年,拓数派发布了一系列产品,比如2022年打造PieCloudDB云原生数据库存算分离等关键技术,2023年3月发布PieDataComputing System数据计算系统首个计算引擎PieCloudDB云原生虚拟数仓,2023年10月发布了大模型数据计算系统,再到2024年推出云原生虚拟数仓PieCloudDB 3.0版本。

“现在大家在淘宝天猫平台购物,淘宝天猫作为平台需要维护的是什么?它不是把冰箱或彩电的实物放在平台上,用户所有的操作其实都是对商品目录的操作,真正下单的时候,冰箱或彩电才会从仓库里出货。”冯雷进一步补充说,拓数派的云原生虚拟数仓PieCloudDB 3.0版本,意味着企业甚至不用把冰箱或彩电从仓库里运出来,拓数派直接把算力推到仓库里对数据进行计算,计算运行后的结果,再给到客户,“这是数仓虚拟化带来的科技价值,可以无限大的发挥数据要素流转能力。”

在冯雷看来,第一步是推动数据要素在局域网里的流转,接下来促进数据在城市等广域网中流转,最后希望可以实现数据要素在全球网络流通的愿景,打造数据市场的淘宝。

此次,拓数派与与浙江平数科技有限公司就政务数据服务产品合作进行了签约,双方将一起就嘉兴平湖市政务数据管理体系、实现数据要素流通和资产化等方面深度合作,“过去两年拓数派和1000强企业的合作就好像让业务在局域网级别实现数据要索流转起来,此次和浙江平数科技的合作,就好像在城域网级别推动数据要素流通。”冯雷说。

在冯雷看来,数据作为新型生产要素,正在推动新质生产力发展,重构新型生产关系。数字生产力加速崛起,数据深刻影响全球科技创新和经济社会发展,成为影响全球竞争的关键战略性资源。

“国内云计算的价格战,一定程度降低了用户使用数据计算的门槛。而在海外,无论是云服务,还是云数仓,其实都卖得挺贵的。”冯雷说,拓数派走向从中国市场走向海外,是很有优势的。

对冯雷而言,除了云计算的发展,AI大模型的发展,也成为推动拓数派深耕云原生虚拟数仓、甚至开拓海外市场的重要力量。

“出海,将是我们2024年的重要战略。”冯雷说,云原生虚拟数仓这样的产品,海外市场也有可以对标的,比如Snowflake。

资料显示,Snowflake作为上市公司,总市值超过500亿美元,最新财报数据中,2023年,Snowflake的营收为28.06亿美元,与上一年的20.66亿美元相比实现增长。不计入某些一次性项目(不按照美国通用会计准则),Snowflake在2023年的调整后净利润为3.533亿美元,而上一年的调整后净利润为9000万美元,超出分析师预期。

如何布局出海?近日拓数派与阿里云共同宣布双方将联合一起出海,迎接海外500强客户。

资料显示,阿里云自2015年走向海外市场以来,持续深入国际化布局,数据中心及团队遍布全球28个地域,运营86个可用区,覆盖超过200多个国家。2023年5月阿里云的数据显示,过去五年,阿里云市场规模增长超20倍,为全球超过400万企业用户提供服务,其中包括超三分之一的全球500强企业,以及超过22万家中国出海企业。据Gartner数据统计,阿里云2022年IaaS市场份额位居全球第三、亚太第一。

“很多一带一路的企业也都在阿里云上部署,我们希望在海外能跟大家一起成长,如此慢慢建立拓数派在全球市场的知名度和影响力。”冯雷说,未来也会在进入美国市场。

来源:周到上海       作者:苗夏丽

海量资讯、精准解读,尽在新浪财经APP
AI 冯雷 人工智能

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-01 宏鑫科技 301539 --
  • 03-29 灿芯股份 688691 --
  • 03-25 中瑞股份 301587 21.73
  • 03-22 广合科技 001389 17.43
  • 03-20 芭薇股份 837023 5.77
  • 新浪首页 语音播报 相关新闻 返回顶部