《科创板日报》9月6日讯(记者 张洋洋)数据作为AI大模型最重要的要素,在大模型深入发展之后,数据这个要素目前发生了何种变化?
在2024外滩大会“从DATA for AI到AI for DATA”见解论坛召开,产学研代表深入探讨了在AI时代数据价值的转变,中国工程院院士、清华大学计算机科学与技术系教授郑纬民,昆仑万维(37.010, -2.90, -7.27%) & 天工智能首席科学家、新加坡工程院院士颜水成参会,分享了数据技术的变化趋势及与AI技术的融合。
▍大模型拉动数据与AI全面对齐
数据一定程度上决定了智能的上限,这使得大模型的技术越要突破,数据技术越要与其“对齐”,大模型对数据利用的“贪婪程度”,也影响了数据的存储、生产、加工、流通、消费各个环节的技术走向。
在存储环节,中国工程院院士、清华大学计算机科学与技术系教授郑纬民表示,大模型生命周期的每一环节都与存储系统有关,在数据获取阶段,需要处理海量多模态小文件,在数据预处理时,则要频繁、随机小样本读取,训练时,检查点文件读写对存储系统提出新的需求,推理时,加载模型参数以及保存中间结果尤为关键,这些挑战也催生了新的技术方案诞生。
大数据时代,数据的价值还没来得及充分挖掘,AI时代一到,数据却面临着消耗过快的挑战,这使得合成数据技术成了热门领域。据研究机构Epoch AI在6月发布的报告显示,从2026年起,人类产生的新数据量将比模型学习的新数据量要少,预估到2028年大语言模型将耗尽人类数据。
昆仑万维&天工智能首席科学家、新加坡工程院院士颜水成认为,模型结构还会继续升级,大模型目前推理能力不够等众多的遗留问题,最好的解决途径可能是用合成数据,但做法不同,不应是根据原来的数据合成新的数据,而是通过大模型之间相互的对话、讨论、评价,最后产生出更好、更高质量的数据,这些数据将会大大去提升大模型的效能。
基础数据库也在加强与AI的融合。国产分布式数据库OceanBase CTO杨传辉介绍了如何通过一套系统同时支持SQL+AI,支持向量数据库,并通过AI技术优化数据库开发和管理工具。
蚂蚁技术研究院院长陈文光提出,向AI“对齐”需要从底层系统角度出发,包括硬件的结构和对应的编程语言、编译系统等。他介绍了在人工智能、科学计算与大数据处理(FABS:Fused AI, Big Data and Science)融合的计算模式思考。
▍探索AI时代的数据战略与实践
从大数据时代到AI时代,数据体系正在从成本和效率中心向价值中心转变,蚂蚁集团平台技术事业群副总裁骆骥认为,在AI时代,数据资产本身的规模、多样性、品质等是决定智能化效果的关键因素。数据更加直接地影响到智能化应用的效果,这就意味着,从数据资产的生产、加工与服务、消费与应用等各个环节都需要围绕数据的价值化这一全新的视角去构建相应的体系与技术能力。
骆骥分享了基于蚂蚁集团业务场景下,AI时代的蚂蚁智能数据体系探索与实践。
他表示,在过去的两年里,蚂蚁集团一直在构建一个围绕融合数据湖、能提供各种数据驱动的智能化应用服务与能力的数据体系,其底层基于全模态存储与计算引擎,上层能支持丰富的智能化业务应用场景。
在底层,蚂蚁构建了行列混存,以及面向新搜索、新交互的向量数据库能力,并且为大模型训练打造了极致的全模态缓存加速的新型存储技术产品。
在核心的融合数据湖里,蚂蚁致力于将结构化数据、半结构化数据与非结构化数据充分融合。除了传统的数据管理与治理、端云/跨云的数据融合和隐私保护之外,还重点关注统一元数据、支持三线一致和Single Source of Truth,以及特别针对非结构化数据的安全可信与品质保障能力等几大关键要素。
在上层的数据应用中,包含了高价值数据的生产(包括数据引入、数据感知、数据标注、数据合成)、全模态的数据研发和面向机器与智能体的新特征服务,以及围绕数据的分析与科学实验工程体系等。
“数据技术领域也正在飞奔进入一个全新的历史阶段。”骆骥说。


APP专享直播
热门推荐
美总统国家安全事务助理谈“轰走”泽连斯基细节:他的大使和顾问几乎都哭了 收起美总统国家安全事务助理谈“轰走”泽连斯基细节:他的大使和顾问几乎都哭了
- 2025年03月02日
- 01:32
- APP专享
- 扒圈小记
4,356
泽连斯基访问英国首相府 与斯塔默握手拥抱
- 2025年03月01日
- 18:05
- APP专享
- 扒圈小记
1,726
西安警方通告!紧急寻人→
- 2025年03月01日
- 03:05
- APP专享
- 北京时间
1,135

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 02:38:12
今天最火热的视频就是老特与小泽谈崩了,没有签订协议,最终不欢而散。老特多次强调,你没有资格要求我们怎么想,你手上都没有牌可打了,但小泽还是不屈服于老特的淫威,不屈服于美国的霸权,小泽还是挺有血性的!弱者无外交,只有自己足够强大才有话语权,我们很荣幸能够出生在中国,背靠祖国的强大,同样,只有股市强,股民才有幸福,你们说A股下周能强起来吗? -
趋势领涨今天 02:37:45
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 00:44:31
三、DeepSeek首次披露:理论成本利润率545%DeepSeek3月1日发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU租赁成本为2美元/小时,总成本为87072美元/天;如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。DeepSeek这个业绩太好了,也难怪减少了股市量化的收割,因为他们找到了更赚钱的买卖!我们要说的是,DeepSeek既然这么赚钱,就别在股市搞量化了。踏踏实实把这个国运级科技产品继续做大做强,把格局放大点!你说呢?不过,受此消息影响,下周DeepSeek有望反弹了,DeepSeek反弹就有望带动科技股反弹,大盘就有希望企稳了,所以,建议大家安心过周末吧。 -
趋势领涨今天 00:44:24
上周五市场一根中阴线彻底将大家砸懵了,很多人一个月的盈利,两天就还回去了,大盘大跌当然是在预期之中,如果你一直是满仓持有到月底,那当然就是还回市场,我们以前说过,D场上最后一个出来的人,一定是输钱最狠的,所以,不是市场不好,主要是你的赌性太大,有时候,人做事不能太吝啬,前面已经赚了那么多了,该放弃就要放弃,不要鱼头鱼尾都要通吃!大盘一根中阴线,行情就结束了吗?答案当然是否定的,12月份底连续三根中阴线,年后大盘不是一样上涨吗?所以,大家也没必要过度悲观,慢牛依然存在,只是要吸取教训,下个撤离时点在本月中旬,届时大家不要又吃鱼身,又要吃鱼尾,鱼尾多刺!一、小泽和老特吵架冲上热搜周末最火爆的事件当然是司机跟老特吵架,这是千百年来第一次有人当面硬扛老美,也让老美在全世界面前脸面尽失!虽然老特多次强调,你没有资格要求我们怎么想,你手上都没有牌可打了,但小泽依然不屈服于老特的淫威,不屈服于老美的霸权,小泽还是挺有血性的!弱者无外交,只有自己足够强大才有话语权,我们很荣幸能够出生在中国,背靠祖国的强大,同样,只有股市强,股民才有幸福,所以,还是让股市强起来吧,让股民也强硬一次!二、重磅数据超出预期周末公布了重磅经济数据,国家统计局数据显示,2月份,制造业采购经理指数(PMI)为50.2%,比上月上升1.1个百分点,制造业景气水平明显回升。从企业规模看,大型企业PMI为52.5%,比上月上升2.6个百分点,高于临界点;中、小型企业PMI分别为49.2%和46.3%,比上月下降0.3和0.2个百分点,均低于临界点。自去年10月份到12月三个月制造业PMI会到50以上后,今年1月份突然从50.1跌到49.1,如此大幅度的回落使大家对经济增长的前景充满了担心,今年一月份到二月份都是在春节期间,一月份数据不好,按道理二月份数据应该也不会很好,结果2月制造业PMI大超预期。数据利好,说明经济复苏强劲,当然利好股市,下周股市有望反弹了! -
趋势领涨今天 00:12:05
大家早上好!趋势为王,做股海的领航者,新的一天,新的战斗,欢迎你来到本直播室!新进的朋友请注意点赞,收藏本直播室,以方便你下次观看,谢谢大家的支持!【更多独家重磅股市观点请点击】 -
趋势起航2025-03-01 14:50:14
【美联邦法官阻止特朗普政府在部分州执行跨性别医疗相关行政令】据美国广播公司当地时间3月1日报道,美国一名联邦法官发布初步禁令,阻止特朗普政府在部分州执行与跨性别医疗相关的两项行政命令,裁定政府命令“篡改了法律”并“规避了权力分立原则”。该初步禁令阻止了一项涉及跨性别青少年医疗护理的行政命令的执行,以及另一项关于向提供跨性别者服务的机构提供联邦资金的行政命令。 (央视新闻) -
趋势起航2025-03-01 14:20:13
埃及央行表示,1月广义货币供应量(M2)同比增长32.1%。 -
趋势起航2025-03-01 13:50:11
德国外交部长贝尔伯克表示,必须立即加大德国对乌克兰的支持。在乌克兰防御问题上,我们必须与波兰、法国和其他国家更紧密地合作。 -
趋势起航2025-03-01 13:20:11
【中金:南向资金周度流入规模创2021年1月以来新高】中金策略指出,互联互通方面,北向资金日均成交规模较上周增加,南向资金加速流入,周度流入规模创2021年1月以来新高。本周南向资金流入749.7亿港币,日均流入149.9亿港币,较此前一周日均流入102.42亿港元再度大幅增长。个股层面,南向本周大幅流入阿里巴巴与中国移动(sh600941),但同时流出美团与中国海洋石油。行业层面,本周南向增持消费与内地银行最多,减持能源及原材料等。 -
趋势起航2025-03-01 12:50:07
【比亚迪(sz002594)2月份销售322846辆 同比增长164%】 比亚迪(sz002594)汽车公布,比亚迪(sz002594)2月份销售322846辆,同比增长164%;其中,乘用车海外销售67025辆,比亚迪(sz002594)汽车王朝丨海洋销售304673辆;方程豹汽车销售4942辆;腾势汽车销售8513辆;仰望汽车销售105辆。