封面新闻记者 朱宁 边雪 陈甘露
距离深度求索(DeepSeek)推理大模型DeepSeek-R1发布已经过去近一周时间,开源模型DeepSeek-V3也已经发布了近一个月。然而,在海外社交媒体平台乃至华尔街,DeepSeek的热度才刚刚开始。
![苹果App Store下载排行](http://n.sinaimg.cn/spider20250127/49/w1024h625/20250127/4f6b-1f0474d8be3cb2c48832d04b90fc1652.jpg)
北京时间1月27日,苹果App Store美国区免费应用下载榜显示,中国大模型应用DeepSeek超越ChatGPT,排名第一,该消息引发美股算力板块大跌,英伟达的主要供应商Advantest Corp.的股价一度暴跌了8.6%,“中国版英伟达”的寒武纪(638.000, -18.00, -2.74%)跌幅一度扩大至接近10%,A股市场中DeepSeek概念股表现强势,不过封顶以后,DeepSeek网页数次崩溃。
DeepSeek是开源界的新“王者”?
近年来,LLM(Large Language Model,大语言模型)经历了快速迭代和演进,逐步缩小了与通用人工智能(AGI) 的差距。
DeepSeek-R1发布后,国外媒体纷纷聚焦DeepSeek,并一致认为中国大模型的新进展为硅谷敲响了警钟:图灵奖得主Yann LeCun评价称,DeepSeek验证了“开源模型正超越闭源系统”。
DeepSeek-R1首次通过纯强化学习(无需监督微调SFT)实现推理能力的突破。实验版本DeepSeek-R1-Zero直接在基座模型上应用RL训练,成功在数学、编程等任务中达到接近人类专家的水平。例如,其在美国数学邀请赛(AIME 2024)中的准确率从初始的15.6%跃升至71%,最终通过多阶段优化提升至86.7%,与OpenAI o1-0912相当。
模型在训练中展现出类似人类的“反思”行为,例如主动暂停推理、重新评估解题步骤并探索替代方案。这种自发的“顿悟时刻”被视为强化学习能力的自然涌现,而非人工编程设计。
团队开发的GRPO(Group Relative Policy Optimization)算法摒弃传统Critic网络,通过群组相对优势估计优化策略,显著降低计算成本。奖励机制结合准确性、格式和语言一致性,确保推理过程结构化且符合人类习惯。
DeepSeek-R1的发布不仅是中国AI技术自主创新的里程碑,更以开源和低成本策略推动全球AI生态向开放、高效方向演进。周鸿祎也公开表示,“中国大模型技术复仇者联盟”已悄然成型,DeepSeek正成为对抗技术霸权的关键力量。
冲击全球算力
DeepSeek或改写市场格局
为何DeepSeek的出现会对英伟达、寒武纪等公司股价带来如此大的冲击?
这是因为在此前,从技术路线来说,OpenAI的成功来自“大力出奇迹”路线,以规模作为大模型的制胜法宝。因此,硅谷巨额的资本支出和运营费用被普遍认为是发展人工智能的最合适方式。
![寒武纪股价走势](http://n.sinaimg.cn/spider20250127/291/w1024h1667/20250127/9538-43686c3a62d87b863a457789b1f65802.jpg)
但这也让AI大模型的发展陷入了一个怪圈:为追求更高的性能,模型体积不断膨胀,参数数量呈现指数级增长。
并且,这种“军备竞赛”型开发模式,带来了惊人的能源消耗和训练成本,难以为继。受大模型训练的高昂成本拖累,OpenAI在2024年的亏损额可能达到50亿美元,业内专家预计到2026年其亏损将进一步攀升至140亿美元。
但DeepSeek出现,对此说法造成了巨大冲击,这让人们对投入人工智能领域的大量资源产生了质疑。
DeepSeek的低成本意味着,大模型对算力投入的需求可能会从训练侧向推理侧倾斜,即未来对推理算力的需求将成为主要驱动力(8.030, 0.15, 1.90%)。而英伟达等硬件商的传统优势更多集中在训练侧,这可能会对其市场地位和战略布局产生影响。
事实上,就在1月25日(周六),英伟达的“老对手”AMD已经火速为DeepSeek“站台”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上,并借助SGLang进行了性能优化。此次集成将助力加速前沿人工智能应用与体验的开发。
在此背景下,这款“物美价廉”的AI模型也引发了资本市场的关注。
本周一,在亚洲盘交易时段,美国股指期货大跌,有分析指出,这背后的主要原因,可能就是华尔街人士们担心DeepSeek的AI模型可能会颠覆美国科技界,与此同时,在日本东京股市,英伟达的主要供应商Advantest Corp.的股价一度暴跌了8.6%。
值得一提的是,DeepSeek在A股的概念股表现出色,每日互动(55.720, 0.72, 1.31%)20%一字封板。浙江东方(8.690, -0.34, -3.77%)、华金资本(17.420, -0.97, -5.27%)、航锦科技(30.250, 2.75, 10.00%)皆开盘涨停,不过被称为“中国版英伟达”的寒武纪跌幅一度扩大至近10%。
低成本、高性能策略
将对行业竞争模式产生深远影响
多位业内人士告诉封面新闻记者,DeepSeek低成本、高性能的低策略将对行业竞争模式产生深远影响。一位国内AI创业公司创始人直言:“DeepSeek用最小的资源实现了最高的效能,向全球企业展示了高效研发的可能性。这种模式的成功,可能迫使行业重新思考‘大模型=大投入’的传统观念。”
另有行业人士表示,DeepSeek集中代表了算法创新带来的模型优化是具有空间的,在底座模型当前并没有显著代际提升的背景下,算法创新将有望加速缩小国内模型和海外模型的差距,但这一现象暂时也没有办法证明未来对于训练环节的算力需求将下降,近期可以看到海外头部大模型厂商的资本开支计划进一步加大,也是证明。
此外,当地时间26日,美国《福布斯》对DeepSeek有一篇名为《关于 DeepSeek :挑战美国科技巨头的中国 AI 初创公司》的深度报道,详细报道了DeepSeek 创业历史、产品迭代以及技术特点,并评价道:“DeepSeek进入人工智能市场给OpenAI、Google和Meta等老牌巨头带来了巨大的竞争压力。通过提供具有成本效益的开源模型,DeepSeek迫使这些主要参与者要么降低价格,要么增强产品以保持相关性。”其中价格优势是《福布斯》文章重点关注的“DeepSeek颠覆性的定价策略已经引发了中国人工智能模型市场的价格战,迫使其他中国科技巨头重新评估和调整其定价结构。此举凸显了DeepSeek颠覆成熟市场和影响整体定价动态的能力。”
本文由封面新闻原创,未经授权不得转载。
授权合作请联系:mp@thecover.cn
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
APP专享直播
热门推荐
男子用DeepSeek买彩票中奖引热议,网友:倒亏5块钱!中国体彩:再强大的AI也无法预测中奖号码! 收起男子用DeepSeek买彩票中奖引热议,网友:倒亏5块钱!中国体彩:再强大的AI也无法预测中奖号码!
- 2025年02月12日
- 13:29
- APP专享
- 扒圈小记
4,598
春晚人形机器人开售即下架?宇树科技回应
- 2025年02月13日
- 02:51
- APP专享
- 扒圈小记
1,767
43岁女子酒吧找00后男模,3个月花光450万公款!被抓后她说……
- 2025年02月13日
- 06:27
- APP专享
- 北京时间
1,728
![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 13:53:41
1、据网络平台数据,电影《哪吒之魔童闹海》总票房(含预售)已达到100亿元,成为中国影史上首部票房达到100亿元的电影。2、阿里巴巴联合创始人、董事局主席蔡崇信确认阿里与苹果合作,此前有报道称,苹果和阿里巴巴将合作为中国iPhone用户开发AI功能。据The Information报道,苹果仍继续与百度合作在中国为iPhone开发AI功能,以此分散风险。3、央行发布货币政策执行报告称,下一阶段,实施好适度宽松的货币政策。根据国内外经济金融形势和金融市场运行情况 择机调整优化政策力度和节奏。4、上海市发改委发布消息,延续实施免费申领新能源汽车牌照额度政策到2025年底,大力促进汽车更新消费。5、国家发改委郑栅洁表示,加力扩围实施“两新”政策,重点支持企业更新高端化、绿色化、智能化设备,扩大消费品以旧换新范围。6、7天5板光线传媒(sz300251):出品、发行的影片《哪吒之魔童闹海》正在热映中。7连板梦网科技(sz002123):公司与DeepSeek系统的开发、应用等核心技术无关。中国电信(sh601728):2月20日占公司总股本的62.7%的限售股锁定期届满并上市流通。7连板杭钢股份(sh600126):算力业务占比极小 不涉及算力核心技术的研发等。 -
趋势领涨今天 13:47:03
A股跌了一天,盘后央妈就发声呵护了:1、实施好适度宽松的货币政策,保持流动性充裕;2、把促进物价合理回升作为把握货币政策的重要考量。现在重点是央行什么时候降准?因为美联储降息预期降低,央行近期降准的概率不大! -
趋势领涨今天 11:35:14
【“惠“聚元宵】乐享头彩!即日起《潜伏擒牛》VIP课程全场六折,半年VIP课程低至881元/月;更有月课1088元/月,季课6折3088元/三个月。活动过后价格会提升,切勿错过!加入至尊擒牛VIP:享四大顶级服务 【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每日一份高端内部绝密文章:包含明日布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!赶紧戳,直接购买:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 11:34:23
华友钴业(sh603799)公告称,公司控股股东华友控股拟自本公告披露之日起1年内,通过上海证券交易所交易系统以集中竞价交易方式增持公司A股股份,增持总金额不低于人民币3亿元,不超过人民币6亿元。增持计划不触及要约收购,不会导致公司控股股东及实际控制人发生变化。 -
趋势领涨今天 10:36:30
【天成自控(sh603085):与广东高域签订战略合作协议 围绕eVTOL等方面开展战略合作】天成自控(sh603085)公告称,公司控股子公司广东天成与广东高域签订《战略合作协议》,双方将基于各自优势资源,共同围绕电动垂直起降飞行器(eVTOL)零部件及材料在技术研发和产品量产等方面开展战略合作。 -
数字江恩今天 09:49:26
最后,这里的c延伸,哪怕延伸也是末端了。不跌破支撑,还可以有时间,但今日高点之上的空间并不大。要控制仓位,而不是肆意重仓了。 -
数字江恩今天 09:49:21
图上的红线,是绿色方框震荡中最后一个低点,和绿色方框最低点,构成了回踩的两道防线。若不跌破红线则表示震荡很强,反之跌破绿色方框最低点则代表昨日拉高是诱多。明日核心是防御,只要回踩不跌破支撑位,那么震荡后下周还要再起一轮。 -
数字江恩今天 09:49:10
昨日已经明确了,拉起为延伸结构,延伸结构主要是看支撑,这里便看1分钟图。图上的绿色方框是之前3300-3330的主体震荡区间,昨日尾盘拉起来之后,今天构造了1分钟级别的顶背离,这也是尾盘下跌的原因。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:48:59
板块来看,今天出现了非常明显的变化。前期强势的deepseek概念、机器人(sz300024)概念今日都出现了较为明显的回踩,部分高位股还跌幅较大。而低位的传媒、酿酒、农林牧渔、地产建筑建材、金融却轮番上涨,但能坚持全天的,也就是传媒、酿酒和农林牧渔。 -
数字江恩今天 09:48:53
A股两市今日成交7058 + 11140 = 18198 亿人民币,相比昨日放量明显。大盘窄幅横盘震荡直至尾盘略微新高后,快速杀跌,收跌14个点。个股方面,只有约20%的个股红盘,但大幅下跌个股家数不多。