大年初四 DeepMind发布新模型激动到一个人

大年初四 DeepMind发布新模型激动到一个人
2025年02月05日 11:00 中关村在线

大年初四,Daya Guo在社交媒体上分享了他最兴奋的事情:亲眼见证了R1-Zero模型性能曲线的持续增长,并直言强化学习(RL)的力量非常强大。

Daya Guo回复网友有关DeepSeek R1的一些问题和公司计划。他透露,尽管R1只是他们研究的开始,但内部研究仍在快速推进,甚至春节期间都没有休息,研究人员一直在努力推动他们的研究成果。他还表示,在尝试将R1应用于形式化证明环境,并希望尽快向社区发布更好的模型。

根据Daya Guo的说法,他们在该领域已经有了进展,并期待未来会有更重磅的模型发布!

DeepMind
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片