1月27日,Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。

苹果美国区应用商店

苹果APP Store中国区免费榜
Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。1月20日,该公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。
作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。
更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek表示,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。此外,DeepSeek不仅将R1训练技术全部公开,还蒸馏了6个小模型向社区开源,允许用户借此训练其他模型。
英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是“首个展示了RL(强化学习)飞轮可以发挥作用且能带来持续增长的OSS(开源软件)项目”。其中,“飞轮”用来形容AI系统中自我强化、正向循环的过程。DeepSeek的论文显示,不同于过去AI模型往往依赖于监督微调(SFT,指AI模型通过已标注的数据进行训练),R1完全由强化学习驱动,证明了直接强化学习是可行的。
Jim Fan写道:“我们正处于一个奇特的时间线上,一家非美国公司正在践行OpenAI最初的使命,即实现真正开放的前沿研究并让所有人受益。这种情况简直无法理解。最有娱乐性的结果却是可能性最大的结果。”
澎湃新闻记者 李潇潇 胡含嫣


APP专享直播
热门推荐
绕过欧尔班?欧洲议会议员被曝想剥夺匈牙利在欧盟的投票权 收起绕过欧尔班?欧洲议会议员被曝想剥夺匈牙利在欧盟的投票权
- 2025年03月06日
- 14:51
- APP专享
- 扒圈小记
5,162
男子往火锅里小便?海底捞:已报案,无论是否摆拍都将追究法律责任
- 2025年03月06日
- 09:33
- APP专享
- 扒圈小记
5,031
36.8万元起,问界M8预售6小时小订超2.1万台!问界M9 2025款小订超1.1万台,余承东发声
- 2025年03月06日
- 09:49
- APP专享
- 北京时间
4,137

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
冯矿伟今天 03:19:57
盘口,进入跌势 -
宋谈股经今天 03:18:06
典型小时线节奏,震荡上行,按今天早盘讲的,不追涨,只低吸方式应对市场。【更多独家重磅股市观点请点击】 -
趋势起航今天 03:16:28
拓维信息(sz002261)大跌! -
徐善武今天 03:16:22
今天指数不会有太大的表现 因为地产、券商、保险还处于下跌中 -
史月波高控盘今天 03:15:57
同一板块的,已经打过底的,比下降趋势反弹的好多了【更多独家重磅股市观点请点击】 -
趋势起航今天 03:15:27
AI方向跳水! -
冯矿伟今天 03:13:57
90分钟保持钝化,120分钟钝化闪烁,120分钟到中午确定 -
徐小明今天 03:10:53
【盘中直播】等中午收盘 -
趋势领涨今天 03:09:35
港股科技股创出新高以后,带动了A股科技股走强,领涨的还是机器人(sz300024),但大盘调整没有结束,不出意外的话,下午大盘还有回落,所以,我们还是认为,科技股拉升短期应该是撤离的机会,现在追涨,风险太大,当然风越大、鱼越贵,看谁接最后一棒吧! -
趋势起航今天 03:07:25
存储芯片板块异动拉升,思科瑞(sh688053)涨超10%,佰维存储(sh688525)、江波龙(sz301308)、国科微(sz300672)、恒烁股份(sh688416)、普冉股份(sh688766)等跟涨