挑战OpenAI霸主地位 DeepSeek同时登顶苹果中美两区App免费榜

挑战OpenAI霸主地位 DeepSeek同时登顶苹果中美两区App免费榜
2025年01月27日 13:18 商业周刊

近日,一家名为深度求索(DeepSeek)的中国AI初创企业在硅谷引起轰动,该公司凭借成本效益高的语言模型DeepSeek-R1,与OpenAI的ChatGPT展开了竞争。1月27日,DeepSeek应用同时登顶苹果中国区和美国区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。这也是历史上首次中国应用能同期在中国和美区苹果App Store占据第一位。

就在前一日,DeepSeek曾出现短时闪崩现象。不少网友反映,使用时遇到 “服务器繁忙” 的提示。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。官方状态页并未将这一事件标记为事故。

目前,DeepSeek已推出两款先进的AI语言模型:面向广泛应用的DeepSeek-V3和旨在作为ChatGPT替代品的DeepSeek-R1。在一系列第三方基准测试中,DeepSeek的模型在从复杂问题解决到数学和编程等多个领域的准确性上,超越了Meta的Llama 3.1、OpenAI的GPT-4o以及Anthropic的Claude Sonnet 3.5。

据悉,成立于2023年的DeepSeek隶属于中国量化交易公司幻方量化(High-Flyer),其创始人梁文峰曾是一位量化对冲基金经理。他组建了一支由来自中国顶尖大学的年轻且雄心勃勃的研究人员组成的团队,并为他们提供了充足的资源和自由,以探索创新想法。这种方法推动了多头潜在注意力架构(MLA)和混合专家架构(MoE)等突破性技术的发展,显著减少了训练模型所需的计算资源。

让硅谷诸多AI巨头感到震撼和汗颜的是DeepSeek的低廉成本。早在去年12月,该公司推出的DeepSeek-V3就通过优化模型架构和基础设施等方式,展现了极致性价比。从该团队正式发布的技术报告来看,包括预训练、上下文长度外推和后训练在内,DeepSeek-V3训练成本仅为558万美元,不到GPT-4o的1/20,且只用了2048张H100的GPU集群,用时仅53天。在同等水平下,哪怕是全球AI第一梯队的头部公司,至少也要用到1.6万张以上的GPU进行训练。

尽管尚不清楚最新发布的DeepSeek-R1的训练成本,但其在服务价格上,相较性能相当的OpenAI的o1也有明显优势。DeepSeek-R1的API服务定价为每百万输入tokens 1元(缓存命中)/ 4元(缓存未命中),分别是OpenAI o1的2%和3.6%。

DeepSeek-V3和ChatGPT虽然都是先进的AI模型,但在关键方面存在差异。DeepSeek-V3针对中文理解和文化背景进行了优化,同时支持全球应用,并特别针对教育、医疗保健和客户服务等行业进行了定制,尤其关注中国市场。相比之下,ChatGPT在全球多样化的数据集上进行训练,更强调英语和西方背景,广泛应用于通用任务、创意写作、编码等多个领域。

外界普遍认为,美国尖端芯片出口管制等限制并没有削弱中国的AI能力,反而似乎在推动DeepSeek等初创公司以优先考虑效率、资源池和协作的方式进行创新。

卡内基国际和平基金会的人工智能研究员马特·希恩(Matt Sheehan)表示:“美国的出口管制实际上将中国公司逼入了绝境,它们必须利用有限的计算资源提高效率。未来我们可能会看到大量与计算资源匮乏相关的整合。”

微软首席执行官萨蒂亚·纳德拉(Satya Nadella)在世界经济论坛上谈到DeepSeek时表示:“DeepSeek的新模型令人印象深刻,他们不仅有效地构建了一个开源模型,能够在推理计算时高效运行,而且在计算效率方面表现出色。我们必须非常非常认真地对待中国的AI进步。”

值得一提的是,DeepSeek愿意将其创新成果开源,使其在全球AI研究社区中获得了更大的赞赏。 与专有模型不同,DeepSeek R1的代码和训练方法在MIT许可证下完全开源,这意味着任何人都可以获取、使用和修改该模型,没有任何限制。

对许多中国AI公司来说,开发开源模型是赶超西方竞争对手的唯一方式,因为这样可以吸引更多用户和贡献者,帮助模型不断成长。在OpenAI逐渐封闭化的当下,DeepSeek的开源得到了AI从业人员的交口称赞。

DeepSeek创始人梁文锋在接受媒体采访时也表示:“在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。”

Meta首席人工智能科学家杨立昆(Yann LeCun)评论称,DeepSeek成功的最大收获不是来自中国竞争对手的加剧威胁,而是保持人工智能模型开源的价值,以便任何人都能受益。“他们有了新的想法,并在其他人的工作基础上加以实现。由于他们的工作成果已发表并开源,因此每个人都可以从中受益。”杨立昆表示,“这就是开放研究和开源的力量。”整理编辑/陈佳靖

海量资讯、精准解读,尽在新浪财经APP
AI 中美 苹果
0条评论|0人参与网友评论
最热评论

APP专享直播

开播时间 | 3-02 09:00
CMF热点会:促进民营企业高质量发展
开播时间 | 2-28 16:00
易方达基金:财经E+N
开播时间 | 2-28 16:00
广发基金:港股创新药风口再起:深度解析港股创新药投资价值
开播时间 | 2-28 16:00
光大证券李泉:市场风格切换,全面挖掘3月市场机遇
开播时间 | 2-28 15:30
国投瑞银:追上军工热点 | DeepSeek驱动军工AI加速发展?
开播时间 | 2-28 15:30
华夏基金:猫头鹰·华夏基金科技策略会
开播时间 | 2-28 14:30
建信基金:智联未来 共启新章——建信基金2025年春季投资策略会
开播时间 | 2-28 14:00
国联安基金:科技引擎全力驱动,市场机遇全解析
开播时间 | 2-28 14:00
华夏基金:车间里的黑科技:AI如何给制造领域"开外挂"?
开播时间 | 2-28 13:58
车间里的黑科技:AI如何给制造领域“开外挂”?
开播时间 | 3-02 09:00
CMF热点会:促进民营企业高质量发展
开播时间 | 2-28 16:00
易方达基金:财经E+N
开播时间 | 2-28 16:00
广发基金:港股创新药风口再起:深度解析港股创新药投资价值
开播时间 | 2-28 16:00
光大证券李泉:市场风格切换,全面挖掘3月市场机遇
开播时间 | 2-28 15:30
国投瑞银:追上军工热点 | DeepSeek驱动军工AI加速发展?
开播时间 | 2-28 15:30
华夏基金:猫头鹰·华夏基金科技策略会
开播时间 | 2-28 14:30
建信基金:智联未来 共启新章——建信基金2025年春季投资策略会
开播时间 | 2-28 14:00
国联安基金:科技引擎全力驱动,市场机遇全解析
开播时间 | 2-28 14:00
华夏基金:车间里的黑科技:AI如何给制造领域"开外挂"?
开播时间 | 2-28 13:58
车间里的黑科技:AI如何给制造领域“开外挂”?
上一页下一页
1/10

热门推荐

吵架后,泽连斯基离开美国 收起
吵架后,泽连斯基离开美国

吵架后,泽连斯基离开美国

  • 2025年03月01日
  • 14:30
  • APP专享
  • 扒圈小记
  • 9,258
APP专享
美总统国家安全事务助理谈“轰走”泽连斯基细节:他的大使和顾问几乎都哭了

美总统国家安全事务助理谈“轰走”泽连斯基细节:他的大使和顾问几乎都哭了

  • 2025年03月02日
  • 01:32
  • APP专享
  • 扒圈小记
  • 4,439
APP专享
乌总统与英首相举行会晤 讨论对乌安全保障等议题

乌总统与英首相举行会晤 讨论对乌安全保障等议题

  • 2025年03月02日
  • 00:20
  • APP专享
  • 北京时间
  • 3,545
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票
三峡能源 4.20 -1.18%
京东方A 4.31 -1.60%
TCL科技 4.62 -2.12%
中远海控 13.62 -0.95%
格力电器 40.85 -1.40%

7X24小时

  • 01-17 宏海科技 920108 5.57
  • 01-16 亚联机械 001395 19.08
  • 01-16 海博思创 688411 19.38
  • 01-14 富岭股份 001356 5.3
  • 01-13 超研股份 301602 6.7
  • 新浪首页 语音播报 相关新闻 返回顶部
    关闭
    关闭
    关闭