事关DeepSeek，硅谷大佬“互掐”！OpenAI又爆巨额融资|硅谷_新浪财经

DeepSeek在硅谷持续引发讨论。

中国大模型创业公司DeepSeek因此前发布的开源模型V3和R1，受到了全球的关注。由于成本低廉、性能良好、透明公开，DeepSeek让人们开始质疑AI投资可能存在的泡沫，也挑战了硅谷在人工智能领域的绝对领先地位。

对此，OpenAI最强劲的竞争对手、硅谷创业公司Anthropic的联合创始人、大语言模型的开创性研究者之一DarioAmodei昨日发表了一篇长文，系统阐述对于DeepSeek的看法。他表示，DeepSeek的训练成本远没有人们说的那么低，“600万美元模型”的说法忽略了许多关键背景。更准确的说法应该是，DeepSeek以更低的成本生成出一个接近7个—10个月前美国模型水平的产品。另外，他还强调，美国应加强芯片出口管制，确保自身走在人工智能发展的前沿。

针对DarioAmodei的观点，顶尖硅谷风险投资家、A16Z联合创始人MarcAndreessen今日发表评论称：“闭源、不透明、吹毛求疵、政治操纵与开源和免费相比，并不是美国所需要的胜利地位。”

虽未直接点名，但DeepSeek正是以开源及免费，在全球AI开源社区中受到普遍认可，而Anthropic开发的Claude模型与OpenAI的GPT模型一样，均属于闭源模型，训练过程及技术细节不对外公开。MarcAndreessen的评论也是在暗讽DarioAmodei，作为AI行业的领军人物，却企图利用地缘政治来遏制对手，否认开源工作，与实现通用人工智能目标的初衷已经背道而驰。

DeepSeek让闭源社区“破防”

记者注意到，这并非MarcAndreessen首次针对DeepSeek发声。早在1月24日，Marc Andreessen在社交平台表示：“DeepSeekR1是我见过的最令人惊叹、最令人印象深刻的突破之一，并且是开源的，是给全世界的礼物。”

当天，英伟达股票下跌超3%，华尔街开始注意到DeepSeek这匹AI黑马，发现AI模型或许不需要依靠堆积算力就能取得卓越性能，从而打破了美股这两年来在AI浪潮中形成的“算力为王”的投资逻辑。有美股大V复盘并分析称，MarcAndreessen针对DeepSeek的推文，或许是DeepSeek爆火出圈的其中一个导火索。

不仅MarcAndreessen，AI领域的另外一个标志人物，斯坦福大学计算机科学系客座教授、谷歌大脑（GoogleBrain）创始人吴恩达（AndrewNg）也发文力挺DeepSeek。吴恩达认为，中国在生成式AI领域正快速缩小与美国的差距，或将重塑AI供应链格局。同时，开源权重模型推动基础模型层走向大众化，为应用开发开辟新机遇，单纯扩大模型规模并非AI发展的唯一出路，在算力军备竞赛的喧嚣中，算法革新正显著降低训练成本。

事实上，DarioAmodei、吴恩达与MarcAndreessen之间的争论，体现的正是闭源与开源两条路线的分歧。DeepSeek之所以在业界掀起轩然大波，除了在有限算力资源下实现的技术突破，让大模型不再是巨头堆算力的游戏，完全开源则是另外一个核心的原因。“开源+低成本”，让DeepSeek颠覆了行业的传统范式，Meta首席人工智能科学家杨立昆此前曾公开表示，DeepSeek的成功彰显了AI模型开源的重要性，“DeepSeek的胜利并非是中国AI的胜利，而是开源模型的胜利”。

有业内人士表示：“当OpenAI在2019年以安全为由转向闭源时，他们实际上是在建立垄断。而DeepSeek证明了开放可能是更好的战略，它能吸引最好的人才，建立生态系统，并通过降低成本而不是提高价格来获取优势。”英伟达高级研究科学家Jim Fan一周前在读完DeepSeek的技术报告后也表示：“我们正身处这样一个历史时刻：一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理，但最有趣的结局往往最可能成真。”

DeepSeek创始人梁文锋在接受媒体采访时曾表示：“在颠覆性的技术面前，闭源形成的护城河是短暂的。即使OpenAI闭源，也无法阻止被别人赶超。”同时，对于DeepSeek开源的做法，梁文锋表示，“开源更像一个文化行为，而非商业行为……我们不会闭源。我们认为先有一个强大的技术生态更重要。”

一般来说，在大模型领域有先发优势及处于技术领先地位的公司，如OpenAI和Anthropic往往倾向于选择闭源，保护自身的技术秘密。有国内大模型从业者告诉记者，DeepSeek作为纯技术驱动的公司，代码和训练方法完全开源，而互联网大厂往往出于商业化等方面的考量不会完全开源。当DeepSeek向市场推出了一款低成本、高性能的模型，并且开源时，无疑对选择闭源路线的公司构成了巨大的冲击。

OpenAI被爆正洽谈新一轮融资

在DeepSeek引发大模型高额投入的效用质疑时，据华尔街日报报道，OpenAI正在洽谈新一轮融资，计划在一轮融资中筹集至多400亿美元，估值将达到3000亿美元，相较此前估值1570亿美元接近翻倍，将成为仅次于埃隆·马斯克旗下SpaceX的全球估值第二高的初创公司。

另外，PitchBook数据显示，这一轮融资将是硅谷历史上最大的一轮融资，并打破OpenAI在2023年创下的融资纪录，当时它从微软融资100亿美元。上述报道还称，在本轮融资中，软银集团将作为领投方投资150亿至250亿美元。若新一轮融资完成，孙正义将更进一步与OpenAI绑定。

值得注意的是，1月22日，美国总统特朗普宣布，OpenAI、软银集团和甲骨文将合资成立一家名为“星际之门”（Stargate）的新公司，计划未来4年在美国投资5000亿美元建设AI基础设施，其中1000亿美元将立即部署。

OpenAI首席执行官山姆·奥特曼此前透露，OpenAI、软银集团、甲骨文和MGX将为该项目总共投入450亿美元，OpenAI和软银集团将各向星际之门注资190亿美元，均持有合资企业40%的股权，而甲骨文和MGX将共同出资70亿美元。据华尔街日报报道，最新一笔融资的资金将部分用于帮助OpenAI履行其对“星际之门”的投资承诺。

DeepSeek发布的AI模型，凭借高性能、便宜、开源等优势，令许多投资者对OpenAI等美国AI开发商的高额AI资本开支策略产生了质疑。奥特曼此前评价DeepSeek时承认，DeepSeek R1让人印象深刻，尤其考虑到成本方面，“但我们无疑将带来更好的模型”。他还表示，“我们相信，要实现我们的使命，更多的计算能力比任何时候都更重要。”

另外，据彭博社报道，知情人士透露，近期OpenAI与微软展开了一项联合调查，针对DeepSeek去年使用OpenAIAPI接口的账户进行审查，并以涉嫌违反服务条款的模型蒸馏为由，取消了他们的访问权限。此前，OpenAI曾向媒体表示，它发现DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据，也即DeepSeek涉嫌“蒸馏”其模型，但拒绝进一步透露其证据的细节。

据记者了解，蒸馏是模型训练中常见的一种做法，简单理解就是用预先训练好的复杂模型作为“教师模型”，用其输出的结果作为监督信号，再去训练另外一个“学生模型”，使学生模型能够逐渐接近于教师模型的水平。由于“从零开始”训练一个模型，需要重复耗费大量计算资源，蒸馏也被视为AI普惠的一种途径，无论是在中国还是美国，初创公司和学术机构使用ChatGPT等领先模型输出数据来训练自己的模型，是业内普遍的现象。

值得注意的是，美东时间1月30日，在美国国家公共电台的节目中，OpenAI全球事务副总裁ChrisLeHane表示，“o3”将在周五发布。紧急上线新模型表明，DeepSeek的崛起已经让OpenAI感受到了威胁，也将让AI领域的竞争更加激烈。