继阿里巴巴CEO吴泳铭宣布要全面“AI 化”后,阿里系相关的蚂蚁集团近期在AI上也动作不断。
昨日,针对关于蚂蚁百灵大模型训练成本的报道,蚂蚁集团第一时间回应《科创板日报》称:蚂蚁针对不同芯片持续调优,以降低AI应用成本,目前取得了一定的进展,也会逐步通过开源分享。
蚂蚁集团在本月发布的最新研究论文显示,其推出了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),前者参数规模为168亿(激活参数27.5亿),Plus基座模型参数规模高达2900亿(激活参数288亿)。实验表明,其3000亿参数的MoE大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。
根据论文,虽然DeepSeek、阿里通义千问、MiniMax等系列的MoE大模型在特定任务中展现出卓越性能,但是MoE模型的训练通常依赖高性能计算资源(如英伟达H100/H800等先进GPU),高昂成本制约了在资源受限环境中的普及应用。同时,近年来英伟达高性能芯片持续短缺,相比之下,低性能加速器供应更充足且单机成本更低。这种差异凸显了构建跨异构计算单元与分布式集群无缝切换技术框架的必要性。
因此,蚂蚁团队设定的目标是“不使用高级GPU”来扩展模型,通过在模型训练环境、优化策略、基础设施、训练过程、评估结果、推理等层面进行优化和落地,旨在突破资源与预算限制实现高效大语言模型训练。
蚂蚁Ling团队在五种不同的硬件配置上对9万亿个token进行Ling-Plus的预训练。其中,使用高性能硬件配置训练1万亿token的预训练成本约为635万元人民币,但蚂蚁的优化方法将使用低规格硬件的训练成本将降至508万元左右,节省了近20%的成本,最终实现与阿里通义Qwen2.5-72B-Instruct和DeepSeek-V2.5-1210-Chat相当的性能。
作为蚂蚁集团自研的大模型,百灵大模型重点布局在生活服务、金融服务、医疗健康等场景的应用。后续,蚂蚁百灵大模型Ling-Plus 和 Ling-Lite将计划开源。
近来,蚂蚁集团在人工智能领域频频加码,其中医疗是一大重点方向。3月21日,蚂蚁集团对外公布了在医疗机构、医生、用户三端最新AI产品体系升级。其中,面向医疗机构,其联合华为医疗卫生军团、阿里云等推出“蚂蚁医疗大模型一体机”;面向好大夫在线的29万注册医生,发布AI医生助手系列工具;同时,服务用户的健康应用“AI健康管家”也推出智能思考、健康自测等十余项新功能。
此外,蚂蚁集团也在拓展具身智能、AI眼镜等方向。
蚂蚁集团已注册成立了上海蚂蚁灵波科技有限公司。作为蚂蚁集团拓展具身智能和机器人(18.620, -0.34, -1.79%)业务的主要载体,蚂蚁灵波科技将面向在家庭、养老、医疗健康等领域,助力上海浦东加快技术引领、行业集聚、产业升级步伐,打造以人形机器人为引领的具身智能创新高地和具有行业影响力的创新产业(58.200, -0.31, -0.53%)生态。
而招聘信息显示,蚂蚁集团近日正招聘AI智能眼镜的产品专家,要求有2C产品的经验。《科创板日报》从接近蚂蚁集团的人士处了解到,蚂蚁近期确实在扩充准备智能眼镜相关业务。


APP专享直播
热门推荐
51岁男子找17岁女孩代孕前已离异 收起51岁男子找17岁女孩代孕前已离异
- 2025年03月27日
- 00:31
- APP专享
- 扒圈小记
33,912
华为智驾大师赛冠军开智驾出车祸?官方回应:协助进行事故处理和医疗安置,提醒用户规范使用智驾功能
- 2025年03月27日
- 02:19
- APP专享
- 扒圈小记
10,934
央行副行长宣昌能:将根据国内外经济金融形势择机降准降息
- 2025年03月27日
- 06:58
- APP专享
- 北京时间
3,711

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
数字江恩今天 10:23:30
【3月限时vip活动】3月板块轮动加快,哪些赛道机会更好?数字江恩《股知道VIP》48小时VIP课程2元(原价8元),月课限时特价979元(原价1088元)。活动截止3月31日。【更多独家重磅股市观点请点击】 -
趋势领涨今天 10:07:58
【南向资金今日净买入逾41亿港元 泡泡玛特获净买入居前】南向资金今日净买入41.42亿港元,其中,泡泡玛特、阿里巴巴-W分别合计获净买入约7.25亿港元、3.64亿港元;盈富基金遭净卖出约14.42亿港元。 -
数字江恩今天 09:33:02
明日看3366-3386之间的选择,若先站上3386,那么2-b还可以延伸一点空间;反之,若先跌破3366,则立即确认2-c回踩开始。这里也不用过于担心,2-c确立后,能否跌破3340还两说了,而且哪怕跌破也空间非常有限。第二浪回踩有望在未来三个交易日内结束。 -
数字江恩今天 09:32:57
看5分钟图,今日的脉冲受阻与图上的3297-3341红色轮谷线。截止今日,3340的2-b结构反弹了54个点,和本人预期的50-60个点相吻合,时间也算合适。正常来说,2-b可以结束了。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:32:44
板块上,今日化工板块继续炒作涨价概念,活跃度第一。光刻机、芯片、新能源、医药医疗也算是局部炒作,总的来说,都是局部炒作,市场没有明显热点。 -
数字江恩今天 09:32:38
A股两市今日成交4965 + 6942 = 11907 亿人民币,相对昨日成交金额略微提升,但成交量下跌。大盘今日低开后脉冲拉起新高,然后全天缓缓回调了约一半拉升幅度。个股方面,红盘个股略微超过了1/3,大幅下跌个股家数86家,和大幅上涨个股家数91家相当。 -
数字江恩今天 09:32:30
2-c回踩呼之欲出 -
趋势领涨今天 09:32:07
沪深北三大交易所年内的发行上市审核全线启动。3月26日,北交所召开年内首场上市委会议,四川西南交大铁路发展股份有限公司过会。有业内人士称,目前IPO申报不需要预沟通,发行人和中介机构可视情况进行申报。另有投行人士表示:“IPO申报数量后续将增加,但市场是否回暖还要再观察。”他认为,判断IPO是否常态化,应综合申报受理、发行上市等整体情况考量。这个是下午大盘回落的原因吗?这叫带病工作! -
北京红竹今天 07:59:00
3、短线有增仓2个组合,基本上长线组合没变化,好几天没有交易了,静等大级别调整之后的布局。短线组合昨天是55%的仓位,酱油股大跌没给机会出来,还在持有,早上跌停又买了一只算力10%的仓位,下午差点干到涨停吃个地天板,仓位就上到了65%。大级别末端只能发挥短线的作用,因为不格局,随时可以撤,这里长线和ETF没办法布局,长线需要格局的。 -
北京红竹今天 07:58:57
2、创业板也是如此创业板我们在直播中跟踪过,现在日线级别回落段基本雏形已经出现了,还差内部结构。如果下周创业板和科创50同时止跌,那么有可能带动沪指再反弹一波,只是预期别太大,格局也别格局就好。目前创业板已经构造出三十分钟级别3段,下周看力度和止跌信号吧。聊点主观的吧,如果下周科创和创业板止跌,沪指大概率还破不了3297点,3325点这里是个强支撑,有可能还会延续反弹。不过大方向依然不变,即便后面反弹也是大级别末端。这里级别不要搞混哦。