挑战DeepSeeK 「AI教母」打造AI模型训练成本不到50美元

挑战DeepSeeK 「AI教母」打造AI模型训练成本不到50美元
2025年02月08日 17:06 电子产品世界

DeepSeek强敌来了! 被誉为「AI教母」的知名华裔美籍科学家李飞飞领导的团队,以低于50美元的云计算成本,成功训练出名为「s1」的人工智能推理模型。 此模型在数学和编码能力测验中的表现,据称媲美OpenAI o1和DeepSeek R1等尖端推理模型。

本文引用地址:

科创板日报、新浪科技报道,李飞飞团队的s1模型并非从头训练,而是建立在阿里巴巴的Qwen2.5 和 Google DeepMind的Gemini 2.0 Flash Thinking的基础之上。 他们搜集了1000个精心挑选的问题及其解答,并通过记录 Gemini 2.0 Flash 的思考过程,建立训练资料集,利用这些资料,微调了Qwen2.5-32B-Instruct模型,创造出s1。

大陆某知名大模型公司CEO表示,李飞飞团队的成就实际上是利用从 Google 模型中撷取的 1000 个样本来微调通义千问模型。 这种微调的成本固然低廉,但其优异表现仍有赖于既有模型的基础。

上海交通大学人工智能学院副教授谢伟迪指出,s1以通义千问模型为基础,因此即使使用有限的样本资料,也能产生新的推理模型。 然而,如果更换其他基础模型,新模型的效能并不会提升。 因此,真正在背后发挥效能的关键是Qwen模型,而非 s1。

阿里云证实,李飞飞团队通过利用阿里开源的Qwen2.5-32B-Instruct模型进行监督微调,在16个英伟达H100 GPU上仅花费26分钟就训练出s1-32B模型,其数学和编码能力与OpenAI o1和DeepSeek R1等尖端推理模型不相上下。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片