来源:华尔街见闻
春节期间,DeepSeek新一代开源模型以惊人的低成本和高性能引发热议,在全球投资界引发剧震。
市场上甚至出现了DeepSeek“仅用500万美元就复制OpenAI”的说法,认为这将给整个AI基础设施产业带来“末日”。
对此,华尔街知名投行伯恩斯坦在详细研究DeepSeek技术文档后发布报告称,这种市场恐慌情绪明显过度,DeepSeek用“500万美元复制OpenAI”是市场误读。
另外,该行认为,虽然DeepSeek的效率提升显著,但从技术角度看,并非奇迹。而且,即便DeepSeek确实实现了10倍的效率提升,这也仅相当于当前AI模型每年的成本增长幅度。
该行还表示,目前AI计算需求远未触及天花板,新增算力很可能会被不断增长的使用需求吸收,因此对AI板块保持乐观。
“500万美元复制OpenAI”是误读
对于“500万美元复制OpenAI”的说法,伯恩斯坦认为,实际上是对DeepSeek V3模型训练成本的片面解读,简单将GPU租用成本计算等同于了总投入:
这500万美元仅仅是基于每GPU小时2美元的租赁价格估算的V3模型训练成本,并未包括前期研发投入、数据成本以及其他相关费用。
技术创新:效率大幅提升但非颠覆性突破
接着,伯恩斯坦在报告中详细分析了DeepSeek发布的两大模型V3、R1详细技术特点。
(1)V3模型的效率革命
该行表示,V3模型采用专家混合架构,用2048块NVIDIA H800 GPU、约270万GPU小时就达到了可与主流大模型媲美的性能。
具体而言,V3模型采用了混合专家(MoE)架构,这一架构本身就旨在降低训练和运行成本。在此基础上,V3还结合了多头潜在注意力(MHLA)技术,显著降低了缓存大小和内存使用。
同时,FP8混合精度训练的运用进一步优化了性能表现。这些技术的综合运用,使得V3模型在训练时仅需同等规模开源模型约9%的算力,便能达到甚至超越其性能。
例如,V3预训练仅需约270万GPU小时,而同样规模的开源LLaMA模型则需要约3000万GPU小时。
- MoE架构: 每次只激活部分参数,减少计算量。
- MHLA技术: 降低内存占用,提升效率。
- FP8混合精度训练: 在保证性能的同时,进一步提升计算效率。
![](http://n.sinaimg.cn/finance/crawl/406/w550h656/20250129/b1da-3dde2bdc3b5932a3ccd3f541867fe112.png)
谈及V3模型带来的效率提升,伯恩斯坦认为,与业界3-7倍的常见效率提升相比并非颠覆性突破:
MoE架构的重点是显著降低训练和运行的成本,因为在任何一次只有一部分参数集是活动的(例如,当训练V3时,只有671B个参数中的37B为任何一个令牌更新,而密集模型中所有参数都被更新)。
对其他MoE比较的调查表明,典型的效率是3-7倍,而类似大小的密度模型具有类似的性能;
V3看起来甚至比这个更好(10倍以上),可能考虑到该公司在模型中带来的其他一些创新,但认为这是完全革命性的想法似乎有点夸张,并且不值得在过去几天里席卷twitter世界的歇斯底里。
(2)R1模型的推理能力与“蒸馏”策略
DeepSeek的R1模型则在V3的基础上,通过强化学习(RL)等创新技术,显著提升了推理能力,使其能够与OpenAI的o1模型相媲美。
![](http://n.sinaimg.cn/finance/crawl/138/w550h388/20250129/2ad4-98ad18f6ad51d46522519b04ca6a33c6.png)
值得一提的是,DeepSeek还采用了“模型蒸馏”策略,利用R1模型作为“教师”,生成数据来微调更小的模型,这些小模型在性能上可以与OpenAI的o1-mini等竞争模型相媲美。这种策略不仅降低了成本,也为AI技术的普及提供了新的思路。
- 强化学习(RL): 提升模型推理能力。
- 模型蒸馏: 利用大模型训练小模型,降低成本。
对AI板块保持乐观
伯恩斯坦认为,即便DeepSeek确实实现了10倍的效率提升,这也仅相当于当前AI模型每年的成本增长幅度。
事实上,在“模型规模定律”不断推动成本上升的背景下,像MoE、模型蒸馏、混合精度计算等创新对AI发展至关重要。
根据杰文斯悖论,效率提升通常会带来更大的需求,而非削减开支。该行认为,目前AI计算需求远未触及天花板,新增算力很可能会被不断增长的使用需求吸收。
基于以上分析,伯恩斯坦对AI板块保持乐观。
责任编辑:何俊熹
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://n.sinaimg.cn/sinanews/eb9bf575/20190108/TouXiang120.png)
![](http://n.sinaimg.cn/sinanews/eb9bf575/20190108/TouXiang120.png)
![](https://tvax1.sinaimg.cn/crop.0.0.132.132.50/008u4fOSly4h46wq3ag9dj303o03oq2s.jpg)
![](http://n.sinaimg.cn/sinanews/eb9bf575/20190108/TouXiang120.png)
![](https://tvax1.sinaimg.cn/crop.0.0.132.132.50/008u4fOSly4h46wq3ag9dj303o03oq2s.jpg)
![](http://n.sinaimg.cn/sinanews/eb9bf575/20190108/TouXiang120.png)
APP专享直播
热门推荐
酒后在小区挪车被认定醉驾吊销驾照,司机起诉交警!法院判了 收起酒后在小区挪车被认定醉驾吊销驾照,司机起诉交警!法院判了
- 2025年02月15日
- 11:55
- APP专享
- 扒圈小记
29,865
事闹大了,前国乒教练尹肖驳斥吴敬平:颠倒黑白!
- 2025年02月16日
- 07:07
- APP专享
- 扒圈小记
2,808
重庆燃气道歉:针对燃气收费问题已派驻整改督导专班
- 2025年02月16日
- 09:51
- APP专享
- 北京时间
2,326
![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势起航今天 15:45:04
【美官员将前往沙特 就俄罗斯相关问题进行会谈】美国中东问题特使威特科夫表示,他将于今晚与美国总统国家安全事务助理迈克·华尔兹一起前往沙特阿拉伯,就俄罗斯相关问题进行会谈。威特科夫表示,希望此次会谈能在俄乌冲突问题上取得一些真正良好的进展。他还称,美国官员也在与乌克兰官员进行单独交谈。乌克兰第一副总理、经济部长尤利娅·斯维里坚科当天则表示,乌克兰政府代表团已开始在沙特筹备乌克兰总统泽连斯基访问沙特。此前多家媒体15日援引美方官员的消息报道,美国国务卿鲁比奥等高级官员定于未来数天内在沙特阿拉伯与俄方代表就乌克兰问题开始谈判,同时为普京与特朗普会面做准备。 -
趋势起航今天 15:15:02
【以色列内阁投票确认扎米尔为下任以军总参谋长】以色列内阁已正式投票确认埃亚勒·扎米尔为以国防军下任总参谋长。扎米尔将于3月5日就职。根据以色列法律,以军总参谋长人选必须先通过高级任命咨询委员会的审查,然后再由内阁投票确认。即将离任的以军总参谋长哈莱维于今年1月21日发表声明说,在2023年10月7日巴勒斯坦伊斯兰抵抗运动(哈马斯)对以色列的袭击中,以军应对失误,自己对此负有责任,因此申请于3月6日辞职,并已将辞职信递交给以色列国防部长卡茨和总理内塔尼亚胡。 -
趋势起航今天 15:10:48
以色列政府批准任命埃亚勒·扎米尔 (Eyal Zamir)为下一任以色列国防军参谋长。 -
趋势领涨今天 11:48:52
中信建投(sh601066)策略陈果团队发文称,当前内需平稳开局,外需扰动有限,稳增长导向明确、地产逐步走出需求冰点、政策推动增量资金入市等因素支撑下,中期市场仍将维持震荡上行趋势不变。近期科技板块涨幅已较可观,部分主题方向短期交易指标存在过热,但对比23年的基本面逻辑,本轮科技行情演绎预计仍有空间,包括港股科技巨头在内的一批代表性公司的估值中枢与上沿也有理由明显高于过去两年,而具体演绎预计科技主线内部可能存在一定的轮动。 -
趋势领涨今天 11:20:10
【“惠“聚元宵】乐享头彩!即日起《潜伏擒牛》VIP课程全场六折,半年VIP课程低至881元/月;更有月课1088元/月,季课6折3088元/三个月。活动过后价格会提升,切勿错过!加入至尊擒牛VIP:享四大顶级服务 【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每日一份高端内部绝密文章:包含明日布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!赶紧戳,直接购买:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 09:42:23
【财政部划转中国农业再保险55.9%股份至中央汇金】中国农业再保险股份有限公司2月14日公告,其控股股东财政部将其持有的中国农业再保险的全部股份(占总股本的55.90%),无偿划转给中央汇金投资有限责任公司。划转完成后,财政部将不再持有任何中国农业再保险股权,中央汇金将持有中国农业再保险约55.90%股份,成为公司控股股东。 -
趋势起航今天 09:19:42
【北京发布网络平台交易新规 未经同意不得滥发营销短信】北京市市场监管局近日公布《网络交易平台经营者服务协议与交易规则合规指引》《网络交易平台经营者信息公示与披露合规指引》《网络交易平台经营者禁限售商品管理合规指引》。指引提出,不得编造、修改、删除、屏蔽消费者的评价信息,也不得好评前置、差评后置误导消费者。自动续费前五日应以显著方式提醒,并提供简便的随时取消或变更选项。 -
趋势起航今天 09:03:21
2015年发生股.灾时,中证金融公司和中央汇金作为国家队救市,买了很多股票,后来中证金融公司一部分股票减持,另一部分股票都转给了中央汇金。现在财政部和中证金融公司又将很多股票转移给了中央汇金,中央汇金的大股东是中投公司,中投公司有四张牌照,中央汇金现在又收到了中证金、信达、长城等三张牌照,相当于中央汇金现在手握七张牌照,后期进行证券整合、处理不良资产是手到擒拿,所以,证券整合、资产重组应该要拉开序幕,下周就看市场炒不炒作了!中金公司(sh601995)现在有钱,有股票,基本能够控制整个市场,所以,将他们称之为平准基金,应该不为过!但经过这次整合以后,后期应该不会推出平准基金了,中央汇金大概率就是所谓的平准基金。 -
趋势领涨今天 07:44:23
周末最大的王炸来了,腾讯的微信正式接入DeepSeek。只要成功接入,那全球范围内没有比DS用户更多的大模型!上一个享受这个待遇是华为鸿蒙,而且鸿蒙是搞了很多年才各方支持的!DeepSeek横空出世不到一个月,就得到了所有巨头的支持,这才叫国运级的产品。DeepSeek破圈最大的作用,就是带来全球AI的平权,我们是最大的受益者!有了AI的助力,人工智能、无人驾驶、低空经济、机器人(sz300024)等新兴产业就能全面发力,让我们的经济换道超车,迎来新一轮增长周期!中国资产、中国科技也会迎来全面重估,A股慢牛也有望正式开启。 -
趋势领涨今天 07:14:00
许多外资巨头看到了中国高科(sh600730)技的力量,纷纷改变了对中国高科(sh600730)技的看法,纷纷唱多中国资产,唱多中国股市。A股科技股迎来一波牛市行情。瑞银给出中美上市公司对标的名单:英伟达——寒武纪(sh688256)(估值比英伟达高312%)、海光信息(sh688041)、地平线机器人(sz300024)、黑芝麻(sz000716)智能;特斯拉——小米集团和理想汽车,折价竟然高达80%甚至90%;台积电——对标中芯国际(sh688981)和华虹半导体;思科——对标中兴通讯(sz000063);meta——对标腾讯;亚马逊——对标阿里巴巴;谷歌——对标百度;阿斯麦——对标北方华创(sz002371)。