DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了

DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了
2025年01月31日 10:41 投资界

*“礼遇”。

一觉醒来,OpenAI和Claude母公司都对DeepSeek出手了

据《金融时报》消息,OpenAI表示已经发现证据,证明DeepSeek利用他们的模型进行训练,这涉嫌侵犯知识产权。

具体来说,他们发现了DeepSeek“蒸馏”OpenAI模型的迹象。即使用更大模型的输出来提高较小模型的性能,从而以较低成本在特定任务上取得类似结果。

微软也开始调查DeepSeek是否使用OpenAI的API。

消息一出,*迎来的是一波嘲讽

纽约大学教授马库斯率先开喷:

知名技术媒体404 Media创始人及主编Jason也直接在文章里贴脸开大,暗讽OpenAI只许州官放火。

而另一边,Claude母公司Anthropic创始人Dario Amodei洋洋洒洒发了一篇长文大谈DeepSeek。

他表示,说DeepSeek构成威胁太夸张了,“也就是我们7-10个月前的水准”,Claude 3.5 Sonnet在许多内部和外部评估中依旧遥遥*。

好家伙,为了围剿DeepSeek,竞对OpenAI和Anthropic罕见都罕见联手了。

相比之下,微软的做法就耐人寻味了许多。

就在指控DeepSeek涉嫌侵权之后几个小时后,微软的AI平台上接入了DeepSeek模型

网友:俗话说,否认是接受的*步。

AI领域常见技术,但违反OpenAI条款

各方消息汇总来看,微软和OpenAI对DeepSeek的质疑还处于调查中。

根据微软工作人员的说法,DeepSeek可能在去年秋天调用了OpenAI的API,这可能导致数据泄露。

按照OpenAI的服务条款规定,任何人都可以注册使用OpenAI的API,但是不能使用输出数据训练对OpenAI造成竞争威胁的模型。

OpenAI告诉《金融时报》,他们发现了一些模型蒸馏的证据,他们怀疑这是DeepSeek的所作所为。

目前,OpenAI拒绝进一步置评,也不愿提供证据细节。

那么不妨先来看看,引发争议的模型蒸馏是什么。

它是一种模型压缩技术,通过将一个复杂的、计算开销大的大模型(称为教师模型)的知识“蒸馏”到一个更小、更高效的模型(称为学生模型)。

这个过程的核心目标是让学生模型在轻量化的同时,尽量保留教师模型的性能。

在诺奖得主、深度学习之父Hinton的论文《Distilling the Knowledge in a Neural Network》中指出:

比如Together AI前段时间的工作,就是把Llama 3蒸馏到Mamba,实现推理速度最高提升1.6倍,性能还更强。

IBM对知识蒸馏的文章中也提到,大多数情况下最*的LLM对计算、成本提出太高要求……知识蒸馏已经成为一种重要手段,能将大模型的先进能力移植到更小的(通常是)开源模型中。因此,它已经成为生成式AI普惠化的一个重要工具

在行业内,一些开源模型的服务条款允许蒸馏。比如Llama,DeepSeek此前也在论文中表示使用了Llama。

而且关键是,DeepSeek R1并非只是简单蒸馏模型,OpenAI首席科学家Mark Chen表示:

同时他也认可了DeepSeek在成本控制上的工作,并提到蒸馏技术的趋势,表示OpenAI也在积极探索模型压缩和优化技术,降低成本。

所以总结一下,模型蒸馏技术在学术界、工业界都非常普遍且被认可,但是违反OpenAI的服务条款。

这河狸吗?不知道。

但问题是,OpenAI自己本身在合规性上也大有问题

(众所周知)OpenAI训练模型把互联网上的数据扒了个干净,这其中除了免费公开的知识内容外,还包含大量有版权的文章作品。

2023年12月,《纽约时报》以侵犯知识产权为由,将微软OpenAI一起告上法庭。目前这个官司还没有最终判定结果,OpenAI这一年时间里就自己的行为向法院进行多次解释。

包括但不限于:

1、使用公开可获得的互联网资料训练AI模型是合理的,这在AI领域内有诸多先例,我们认为这对创作者是公平的,对于创新是必要的。

2、长期以来,版权著作被非商业性使用(比如训练大模型)是受到合理保护的。

3、大语言模型的关键是Scaling,这意味着任何单独被盗的内容都不足以支撑训练出一个大语言模型,这正是OpenAI模型为何*。

也就是说,OpenAI本身都在违规使用《纽约时报》的数据训练闭源、商业化的大模型。现在他们要以违规为由,调查打造系列开源模型的DeepSeek。

再退一步,OpenAI如今的成就也是建立在谷歌的基础上(Transformer架构由谷歌提出),谷歌的成就是站立在更早期的学术研究基础上。

404 Media表示,这其实是人工智能领域发展的基本逻辑。

“DeepSeek模型只在成本上*”

就在OpenAI挑起矛盾的同时,Anthropic也下场了。

创始人Dario Amodei在个人博客中表达了对DeepSeek的看法。

他表示并没有把DeepSeek看做是竞争对手,认为DS最新模型的水平和他们7-10个月前相当,只是成本大幅降低。

同时他还认为,DeepSeek整个公司的成本投入(非单个模型训练成本)和Anthropic的AI实验室差不多。

奥特曼几乎保持了同样的口径。

他承认DeepSeek R1让人印象深刻(尤其是成本),但OpenAI“很明显会带来更好的模型”。

这也是他的常规操作了,之前V3发布时,他就阴阳怪气说:相对而言,复制确定有用的东西是很容易的。

那么DeepSeek R1的价值究竟几何?

分析师郭明錤最新博客给出参考:

DeepSeek R1的出现,让两个趋势更加值得关注——虽然没有R1这两个趋势也依然存在,但R1加速了它们的发生。

一是在Scaling Law放缓的情况下,AI算力仍可透过优化训练方式持续成长,并有利挖掘新应用。

过去1-2年,投资者对AI服务器供应链的投资逻辑,主要基于AI服务器的出货量在Scaling Law依然有效的情况下可持续增长。

但Scaling law的边际效益开始逐渐递减,市场开始关注以DeepSeek为代表的通过Scaling law以外的方式显著提升模型效益的路径。

第二个趋势是API/Token价格的显著下滑,有利于加速AI应用的多元化

郭明錤认为,目前从生成式AI趋势中获利的方式,主要还是“卖铲子”和降低成本,而不是创造新业务或提升既有业务的附加值。

而DeepSeek-R1的定价策略,会带动生成式AI的整体使用成本下降,这有助于增加AI算力需求,并且可以降低投资人对AI投资能否获利的疑虑。

不过,使用量的提升程度能否抵消价格降低带来的影响,仍然有待观察。

同时,郭明錤表示,只有大量部署者才会遇到Scaling law边际效益的放缓,因此当边际效益再度加速时,英伟达将依然是赢家。

参考链接:

[1]https://www.404media.co/openai-furious-deepseek-might-have-stolen-all-the-data-openai-stole-from-us/

[2]https://www.ft.com/content/a0dfedd1-5255-4fa9-8ccc-1fe01de87ea6?accessToken=zwAGLNJX-fBAkdOg3-3RUlVPqdOMzB_gHeh-pg.MEYCIQCGjo04z0mtOsKbDspQLq2BMXyw8SbQnlYePOuqiqr6QgIhAInK67eBkYuZS-77ljnP-y--EJdN1wwRQ8GIR8sKMFgE&sharetype=gift&token=1eebbaa7-a4e6-4251-b665-c2f2562b38e4

[3]https://x.com/GaryMarcus/status/1884601187271581941

[4]https://mingchikuo.craft.me/g8mybRumSTYD3J

【本文由投资界合作伙伴微信公众号:量子位授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。

海量资讯、精准解读,尽在新浪财经APP
微软 美国
0条评论|0人参与网友评论
最热评论

APP专享直播

开播时间 | 2-26 15:30
海通证券肖鑫雨、华夏基金单宽之:全市场首只!创业板新能源究竟有何亮点?
开播时间 | 2-26 15:30
华安基金:指数大学堂:AI浪潮澎湃,港股科技怎么投?
开播时间 | 2-26 15:30
博时基金:AI驱动量化投资:科技浪潮中的机遇与挑战
开播时间 | 2-26 16:00
国君资管:股债虽波动,难掩市场韧性?
开播时间 | 2-26 16:00
光大新"机"遇:国产AI大模型强势突围,科技股领衔春季躁动行情
开播时间 | 2-26 16:00
易方达基金:债基投资在线答
开播时间 | 2-26 16:00
华夏基金:如何告别“1时代”理财焦虑?
开播时间 | 2-26 16:00
天弘基金:天弘固收+ 市场的矛盾变化与胜负手
开播时间 | 2-26 14:00
天弘基金:机器人崛起 年度黑马?就选机器人
开播时间 | 2-26 14:00
张翔、盘和林等热议“特斯拉FSD悄然入华,中国车企该如何接招?”
开播时间 | 2-26 15:30
海通证券肖鑫雨、华夏基金单宽之:全市场首只!创业板新能源究竟有何亮点?
开播时间 | 2-26 15:30
华安基金:指数大学堂:AI浪潮澎湃,港股科技怎么投?
开播时间 | 2-26 15:30
博时基金:AI驱动量化投资:科技浪潮中的机遇与挑战
开播时间 | 2-26 16:00
国君资管:股债虽波动,难掩市场韧性?
开播时间 | 2-26 16:00
光大新"机"遇:国产AI大模型强势突围,科技股领衔春季躁动行情
开播时间 | 2-26 16:00
易方达基金:债基投资在线答
开播时间 | 2-26 16:00
华夏基金:如何告别“1时代”理财焦虑?
开播时间 | 2-26 16:00
天弘基金:天弘固收+ 市场的矛盾变化与胜负手
开播时间 | 2-26 14:00
天弘基金:机器人崛起 年度黑马?就选机器人
开播时间 | 2-26 14:00
张翔、盘和林等热议“特斯拉FSD悄然入华,中国车企该如何接招?”
上一页下一页
1/10

热门推荐

最低500万美元,特朗普推出移民“金卡”,取代EB-5签证 收起
最低500万美元,特朗普推出移民“金卡”,取代EB-5签证

最低500万美元,特朗普推出移民“金卡”,取代EB-5签证

  • 2025年02月26日
  • 00:02
  • APP专享
  • 扒圈小记
  • 9,869
APP专享
俄会展基金会:乌克兰大部分最具价值的矿藏已归入俄罗斯

俄会展基金会:乌克兰大部分最具价值的矿藏已归入俄罗斯

  • 2025年02月25日
  • 08:47
  • APP专享
  • 扒圈小记
  • 3,041
APP专享
美国“政府效率部”21名工作人员辞职 称不愿帮助削减政府规模

美国“政府效率部”21名工作人员辞职 称不愿帮助削减政府规模

  • 2025年02月26日
  • 01:35
  • APP专享
  • 北京时间
  • 2,902
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票
三峡能源 4.25 +0.47%
京东方A 4.48 -1.54%
TCL科技 4.82 -0.82%
中远海控 13.82 +0.22%
格力电器 40.92 +1.04%
广告

7X24小时

  • 01-17 宏海科技 920108 5.57
  • 01-16 亚联机械 001395 19.08
  • 01-16 海博思创 688411 19.38
  • 01-14 富岭股份 001356 5.3
  • 01-13 超研股份 301602 6.7
  • 新浪首页 语音播报 相关新闻 返回顶部
    关闭
    关闭