DeepSeek在硅谷持续引发讨论。
中国大模型创业公司DeepSeek因此前发布的开源模型V3和R1,受到了全球的关注。由于成本低廉、性能良好、透明公开,DeepSeek让人们开始质疑AI投资可能存在的泡沫,也挑战了硅谷在人工智能领域的绝对领先地位。
对此,OpenAI最强劲的竞争对手、硅谷创业公司Anthropic的联合创始人、大语言模型的开创性研究者之一DarioAmodei昨日发表了一篇长文,系统阐述对于DeepSeek的看法。他表示,DeepSeek的训练成本远没有人们说的那么低,“600万美元模型”的说法忽略了许多关键背景。更准确的说法应该是,DeepSeek以更低的成本生成出一个接近7个—10个月前美国模型水平的产品。另外,他还强调,美国应加强芯片出口管制,确保自身走在人工智能发展的前沿。
针对DarioAmodei的观点,顶尖硅谷风险投资家、A16Z联合创始人MarcAndreessen今日发表评论称:“闭源、不透明、吹毛求疵、政治操纵与开源和免费相比,并不是美国所需要的胜利地位。”

虽未直接点名,但DeepSeek正是以开源及免费,在全球AI开源社区中受到普遍认可,而Anthropic开发的Claude模型与OpenAI的GPT模型一样,均属于闭源模型,训练过程及技术细节不对外公开。MarcAndreessen的评论也是在暗讽DarioAmodei,作为AI行业的领军人物,却企图利用地缘政治来遏制对手,否认开源工作,与实现通用人工智能目标的初衷已经背道而驰。

DeepSeek让闭源社区“破防”
记者注意到,这并非MarcAndreessen首次针对DeepSeek发声。早在1月24日,Marc Andreessen在社交平台表示:“DeepSeekR1是我见过的最令人惊叹、最令人印象深刻的突破之一,并且是开源的,是给全世界的礼物。”
当天,英伟达股票下跌超3%,华尔街开始注意到DeepSeek这匹AI黑马,发现AI模型或许不需要依靠堆积算力就能取得卓越性能,从而打破了美股这两年来在AI浪潮中形成的“算力为王”的投资逻辑。有美股大V复盘并分析称,MarcAndreessen针对DeepSeek的推文,或许是DeepSeek爆火出圈的其中一个导火索。
不仅MarcAndreessen,AI领域的另外一个标志人物,斯坦福大学计算机科学系客座教授、谷歌大脑(GoogleBrain)创始人吴恩达(AndrewNg)也发文力挺DeepSeek。吴恩达认为,中国在生成式AI领域正快速缩小与美国的差距,或将重塑AI供应链格局。同时,开源权重模型推动基础模型层走向大众化,为应用开发开辟新机遇,单纯扩大模型规模并非AI发展的唯一出路,在算力军备竞赛的喧嚣中,算法革新正显著降低训练成本。
事实上,DarioAmodei、吴恩达与MarcAndreessen之间的争论,体现的正是闭源与开源两条路线的分歧。DeepSeek之所以在业界掀起轩然大波,除了在有限算力资源下实现的技术突破,让大模型不再是巨头堆算力的游戏,完全开源则是另外一个核心的原因。“开源+低成本”,让DeepSeek颠覆了行业的传统范式,Meta首席人工智能科学家杨立昆此前曾公开表示,DeepSeek的成功彰显了AI模型开源的重要性,“DeepSeek的胜利并非是中国AI的胜利,而是开源模型的胜利”。
有业内人士表示:“当OpenAI在2019年以安全为由转向闭源时,他们实际上是在建立垄断。而DeepSeek证明了开放可能是更好的战略,它能吸引最好的人才,建立生态系统,并通过降低成本而不是提高价格来获取优势。”英伟达高级研究科学家Jim Fan一周前在读完DeepSeek的技术报告后也表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
DeepSeek创始人梁文锋在接受媒体采访时曾表示:“在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。”同时,对于DeepSeek开源的做法,梁文锋表示,“开源更像一个文化行为,而非商业行为……我们不会闭源。我们认为先有一个强大的技术生态更重要。”
一般来说,在大模型领域有先发优势及处于技术领先地位的公司,如OpenAI和Anthropic往往倾向于选择闭源,保护自身的技术秘密。有国内大模型从业者告诉记者,DeepSeek作为纯技术驱动的公司,代码和训练方法完全开源,而互联网大厂往往出于商业化等方面的考量不会完全开源。当DeepSeek向市场推出了一款低成本、高性能的模型,并且开源时,无疑对选择闭源路线的公司构成了巨大的冲击。

OpenAI被爆正洽谈新一轮融资
在DeepSeek引发大模型高额投入的效用质疑时,据华尔街日报报道,OpenAI正在洽谈新一轮融资,计划在一轮融资中筹集至多400亿美元,估值将达到3000亿美元,相较此前估值1570亿美元接近翻倍,将成为仅次于埃隆·马斯克旗下SpaceX的全球估值第二高的初创公司。
另外,PitchBook数据显示,这一轮融资将是硅谷历史上最大的一轮融资,并打破OpenAI在2023年创下的融资纪录,当时它从微软融资100亿美元。上述报道还称,在本轮融资中,软银集团将作为领投方投资150亿至250亿美元。若新一轮融资完成,孙正义将更进一步与OpenAI绑定。
值得注意的是,1月22日,美国总统特朗普宣布,OpenAI、软银集团和甲骨文将合资成立一家名为“星际之门”(Stargate)的新公司,计划未来4年在美国投资5000亿美元建设AI基础设施,其中1000亿美元将立即部署。
OpenAI首席执行官山姆·奥特曼此前透露,OpenAI、软银集团、甲骨文和MGX将为该项目总共投入450亿美元,OpenAI和软银集团将各向星际之门注资190亿美元,均持有合资企业40%的股权,而甲骨文和MGX将共同出资70亿美元。据华尔街日报报道,最新一笔融资的资金将部分用于帮助OpenAI履行其对“星际之门”的投资承诺。
DeepSeek发布的AI模型,凭借高性能、便宜、开源等优势,令许多投资者对OpenAI等美国AI开发商的高额AI资本开支策略产生了质疑。奥特曼此前评价DeepSeek时承认,DeepSeek R1让人印象深刻,尤其考虑到成本方面,“但我们无疑将带来更好的模型”。他还表示,“我们相信,要实现我们的使命,更多的计算能力比任何时候都更重要。”
另外,据彭博社报道,知情人士透露,近期OpenAI与微软展开了一项联合调查,针对DeepSeek去年使用OpenAIAPI接口的账户进行审查,并以涉嫌违反服务条款的模型蒸馏为由,取消了他们的访问权限。此前,OpenAI曾向媒体表示,它发现DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据,也即DeepSeek涉嫌“蒸馏”其模型,但拒绝进一步透露其证据的细节。
据记者了解,蒸馏是模型训练中常见的一种做法,简单理解就是用预先训练好的复杂模型作为“教师模型”,用其输出的结果作为监督信号,再去训练另外一个“学生模型”,使学生模型能够逐渐接近于教师模型的水平。由于“从零开始”训练一个模型,需要重复耗费大量计算资源,蒸馏也被视为AI普惠的一种途径,无论是在中国还是美国,初创公司和学术机构使用ChatGPT等领先模型输出数据来训练自己的模型,是业内普遍的现象。
值得注意的是,美东时间1月30日,在美国国家公共电台的节目中,OpenAI全球事务副总裁ChrisLeHane表示,“o3”将在周五发布。紧急上线新模型表明,DeepSeek的崛起已经让OpenAI感受到了威胁,也将让AI领域的竞争更加激烈。


APP专享直播
热门推荐
特朗普:移民金卡会卖疯的,要有1000万人买,就能赚50万亿还清美国债务 收起特朗普:移民金卡会卖疯的,要有1000万人买,就能赚50万亿还清美国债务
- 2025年02月27日
- 03:52
- APP专享
- 扒圈小记
3,043
美媒:特朗普称,他有可能无法促成俄乌和平
- 2025年02月27日
- 01:03
- APP专享
- 扒圈小记
2,272
特朗普:不再向乌方提供新军援,普京必须在谈判中让步!他还称将给欧盟加25%关税,由欧洲保障乌克兰安全!
- 2025年02月27日
- 01:11
- APP专享
- 北京时间
2,065

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 12:26:48
今天最大的新闻,雷军盘中成为中国新首富。但收盘小米集团大跌,又把首富拱手让给卖水的钟睒睒了!从2022年至今,小米港股累计涨幅已经超过570%。小米股票在今天又再次创下了历史新高。而雷军持有小米集团约24.2%的股份,对应市值约3412亿元人民币。 -
趋势领涨今天 11:03:55
【九号公司(sh689009):2024年净利润10.88亿元 同比增长81.9%】九号公司(sh689009)(***)公告称,2024年营业总收入为141.71亿元,同比增长38.63%;归属于母公司所有者的净利润为10.88亿元,同比增长81.90%。主要原因是公司通过优化经营策略,开拓市场,使得电动两轮车、电动滑板车、全地形车和服务机器人(sz300024)等业务条线的产品销量持续增长。 -
趋势领涨今天 10:03:13
【九号公司(sh689009):2024年净利润10.88亿元 同比增长81.9%】九号公司(sh689009)(689009.SH)公告称,2024年营业总收入为141.71亿元,同比增长38.63%;归属于母公司所有者的净利润为10.88亿元,同比增长81.90%。主要原因是公司通过优化经营策略,开拓市场,使得电动两轮车、电动滑板车、全地形车和服务机器人(sz300024)等业务条线的产品销量持续增长。 -
趋势领涨今天 09:43:09
国家能源局:光伏内卷式竞争仍未根本解决 正在配合有关部门研究完善政策措施;支持能源体系低碳转型 加大对充电基础设施领域的金融支持。银行保险机构要围绕太阳能(sz000591)光伏、风电、水电、抽水蓄能、特高压、核能、储能、智能电网、微电网等新能源产业生产、建设和运营以及更新、升级和改造。 -
数字江恩今天 09:34:48
直接看近期的5分钟图。今天的回踩是非常技术性的,3356区间反复磨蹭之后,最低点3353就快速拉起,和本人昨日给的3350支撑非常吻合。大盘走出这个的形态,应该说3384之后的宽幅震荡,有了明显的之字形特征,低点3337看为支撑。而在未来两个交易日之内,看图上的红色轮谷线,这条轮谷线只要不跌破,那么大盘首先要攻打3400以上的空间。毕竟恒生早就突破了3674对应位置,A股一直在3400之下也是不恰当的。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:34:23
板块来说,今天变化非常明显,之前炙手可热的云概念和机器人(sz300024)今日回踩幅度较大。而大消费类、新能源类,今天则表现不错。权重方向,金融石油酿酒地产建筑都有表现。 -
数字江恩今天 09:34:15
A股两市今日成交7741 + 12305 = 20046 亿人民币,再次超过2万亿的成交金额显示出了市场的热情。大盘今日先回踩下试了3356区间的支撑,然后强力反弹,收涨8个点。个股方面,涨跌比约为4:6。 -
数字江恩今天 09:34:10
看轮谷线支撑 -
趋势领涨今天 07:59:34
【今日投资舆情热点】1)算力相关:DeepSeek作为开源AI大模型,各大厂商纷纷宣布接入,将直接拉动对于算力及云服务的需求。2)食品消费:五部门印发《优化消费环境三年行动方案(2025-2027年)》,到2027年,消费供给提质、消费秩序优化、消费维权提效、消费环境共治、消费环境引领等五大行动深入开展。3)机器人(sz300024):机构称,大模型快速迭代,推动具身智能大发展,特斯拉不再是产业链唯一风向标,将会涌现出来更多参与者。4)固态电池:中国电动汽车百人会表示,在新能源汽车领域,预计到2027年全固态电池开始装车,预计到2030年可以实现量产化应用。 -
趋势领涨今天 07:58:31
【今日投资舆情热点】1)算力相关:DeepSeek作为开源AI大模型,各大厂商纷纷宣布接入,将直接拉动对于算力及云服务的需求。2)食品消费:五部门印发《优化消费环境三年行动方案(2025-2027年)》,到2027年,消费供给提质、消费秩序优化、消费维权提效、消费环境共治、消费环境引领等五大行动深入开展。3)机器人(sz300024):机构称,大模型快速迭代,推动具身智能大发展,特斯拉不再是产业链唯一风向标,将会涌现出来更多参与者。4)固态电池:中国电动汽车百人会表示,在新能源汽车领域,预计到2027年全固态电池开始装车,预计到2030年可以实现量产化应用。