*“礼遇”。
一觉醒来,OpenAI和Claude母公司都对DeepSeek出手了。
据《金融时报》消息,OpenAI表示已经发现证据,证明DeepSeek利用他们的模型进行训练,这涉嫌侵犯知识产权。
具体来说,他们发现了DeepSeek“蒸馏”OpenAI模型的迹象。即使用更大模型的输出来提高较小模型的性能,从而以较低成本在特定任务上取得类似结果。
微软也开始调查DeepSeek是否使用OpenAI的API。

消息一出,*迎来的是一波嘲讽。
纽约大学教授马库斯率先开喷:

知名技术媒体404 Media创始人及主编Jason也直接在文章里贴脸开大,暗讽OpenAI只许州官放火。

而另一边,Claude母公司Anthropic创始人Dario Amodei洋洋洒洒发了一篇长文大谈DeepSeek。
他表示,说DeepSeek构成威胁太夸张了,“也就是我们7-10个月前的水准”,Claude 3.5 Sonnet在许多内部和外部评估中依旧遥遥*。

好家伙,为了围剿DeepSeek,竞对OpenAI和Anthropic罕见都罕见联手了。
相比之下,微软的做法就耐人寻味了许多。
就在指控DeepSeek涉嫌侵权之后几个小时后,微软的AI平台上接入了DeepSeek模型。

网友:俗话说,否认是接受的*步。

AI领域常见技术,但违反OpenAI条款
各方消息汇总来看,微软和OpenAI对DeepSeek的质疑还处于调查中。
根据微软工作人员的说法,DeepSeek可能在去年秋天调用了OpenAI的API,这可能导致数据泄露。
按照OpenAI的服务条款规定,任何人都可以注册使用OpenAI的API,但是不能使用输出数据训练对OpenAI造成竞争威胁的模型。

OpenAI告诉《金融时报》,他们发现了一些模型蒸馏的证据,他们怀疑这是DeepSeek的所作所为。
目前,OpenAI拒绝进一步置评,也不愿提供证据细节。
那么不妨先来看看,引发争议的模型蒸馏是什么。
它是一种模型压缩技术,通过将一个复杂的、计算开销大的大模型(称为教师模型)的知识“蒸馏”到一个更小、更高效的模型(称为学生模型)。
这个过程的核心目标是让学生模型在轻量化的同时,尽量保留教师模型的性能。
在诺奖得主、深度学习之父Hinton的论文《Distilling the Knowledge in a Neural Network》中指出:

比如Together AI前段时间的工作,就是把Llama 3蒸馏到Mamba,实现推理速度最高提升1.6倍,性能还更强。

IBM对知识蒸馏的文章中也提到,大多数情况下最*的LLM对计算、成本提出太高要求……知识蒸馏已经成为一种重要手段,能将大模型的先进能力移植到更小的(通常是)开源模型中。因此,它已经成为生成式AI普惠化的一个重要工具。

在行业内,一些开源模型的服务条款允许蒸馏。比如Llama,DeepSeek此前也在论文中表示使用了Llama。
而且关键是,DeepSeek R1并非只是简单蒸馏模型,OpenAI首席科学家Mark Chen表示:

同时他也认可了DeepSeek在成本控制上的工作,并提到蒸馏技术的趋势,表示OpenAI也在积极探索模型压缩和优化技术,降低成本。

所以总结一下,模型蒸馏技术在学术界、工业界都非常普遍且被认可,但是违反OpenAI的服务条款。
这河狸吗?不知道。
但问题是,OpenAI自己本身在合规性上也大有问题。
(众所周知)OpenAI训练模型把互联网上的数据扒了个干净,这其中除了免费公开的知识内容外,还包含大量有版权的文章作品。
2023年12月,《纽约时报》以侵犯知识产权为由,将微软OpenAI一起告上法庭。目前这个官司还没有最终判定结果,OpenAI这一年时间里就自己的行为向法院进行多次解释。
包括但不限于:
1、使用公开可获得的互联网资料训练AI模型是合理的,这在AI领域内有诸多先例,我们认为这对创作者是公平的,对于创新是必要的。
2、长期以来,版权著作被非商业性使用(比如训练大模型)是受到合理保护的。
3、大语言模型的关键是Scaling,这意味着任何单独被盗的内容都不足以支撑训练出一个大语言模型,这正是OpenAI模型为何*。
也就是说,OpenAI本身都在违规使用《纽约时报》的数据训练闭源、商业化的大模型。现在他们要以违规为由,调查打造系列开源模型的DeepSeek。
再退一步,OpenAI如今的成就也是建立在谷歌的基础上(Transformer架构由谷歌提出),谷歌的成就是站立在更早期的学术研究基础上。
404 Media表示,这其实是人工智能领域发展的基本逻辑。

“DeepSeek模型只在成本上*”
就在OpenAI挑起矛盾的同时,Anthropic也下场了。
创始人Dario Amodei在个人博客中表达了对DeepSeek的看法。
他表示并没有把DeepSeek看做是竞争对手,认为DS最新模型的水平和他们7-10个月前相当,只是成本大幅降低。
同时他还认为,DeepSeek整个公司的成本投入(非单个模型训练成本)和Anthropic的AI实验室差不多。
奥特曼几乎保持了同样的口径。
他承认DeepSeek R1让人印象深刻(尤其是成本),但OpenAI“很明显会带来更好的模型”。

这也是他的常规操作了,之前V3发布时,他就阴阳怪气说:相对而言,复制确定有用的东西是很容易的。

那么DeepSeek R1的价值究竟几何?
分析师郭明錤最新博客给出参考:
DeepSeek R1的出现,让两个趋势更加值得关注——虽然没有R1这两个趋势也依然存在,但R1加速了它们的发生。
一是在Scaling Law放缓的情况下,AI算力仍可透过优化训练方式持续成长,并有利挖掘新应用。
过去1-2年,投资者对AI服务器供应链的投资逻辑,主要基于AI服务器的出货量在Scaling Law依然有效的情况下可持续增长。
但Scaling law的边际效益开始逐渐递减,市场开始关注以DeepSeek为代表的通过Scaling law以外的方式显著提升模型效益的路径。
第二个趋势是API/Token价格的显著下滑,有利于加速AI应用的多元化。
郭明錤认为,目前从生成式AI趋势中获利的方式,主要还是“卖铲子”和降低成本,而不是创造新业务或提升既有业务的附加值。
而DeepSeek-R1的定价策略,会带动生成式AI的整体使用成本下降,这有助于增加AI算力需求,并且可以降低投资人对AI投资能否获利的疑虑。
不过,使用量的提升程度能否抵消价格降低带来的影响,仍然有待观察。
同时,郭明錤表示,只有大量部署者才会遇到Scaling law边际效益的放缓,因此当边际效益再度加速时,英伟达将依然是赢家。
参考链接:
[1]https://www.404media.co/openai-furious-deepseek-might-have-stolen-all-the-data-openai-stole-from-us/
[2]https://www.ft.com/content/a0dfedd1-5255-4fa9-8ccc-1fe01de87ea6?accessToken=zwAGLNJX-fBAkdOg3-3RUlVPqdOMzB_gHeh-pg.MEYCIQCGjo04z0mtOsKbDspQLq2BMXyw8SbQnlYePOuqiqr6QgIhAInK67eBkYuZS-77ljnP-y--EJdN1wwRQ8GIR8sKMFgE&sharetype=gift&token=1eebbaa7-a4e6-4251-b665-c2f2562b38e4
[3]https://x.com/GaryMarcus/status/1884601187271581941
[4]https://mingchikuo.craft.me/g8mybRumSTYD3J
【本文由投资界合作伙伴微信公众号:量子位授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。


APP专享直播
热门推荐
媒体评亚洲杯饭圈乱象扰乱赛场秩序 收起媒体评亚洲杯饭圈乱象扰乱赛场秩序
- 2025年02月26日
- 06:43
- APP专享
- 扒圈小记
60,009
“女生遭侵犯落水被阻挡上岸致溺亡”案将于28日二审,此前检方抗诉建议死刑
- 2025年02月26日
- 11:51
- APP专享
- 扒圈小记
17,961
方媛在米兰遭抢劫当地华人发声:可能会有小偷盯着亚洲面孔,在路上不要玩手机
- 2025年02月26日
- 11:29
- APP专享
- 北京时间
1,954

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
股市直播
-
冯矿伟今天 04:30:42
冯矿伟:背离周一形成的60分钟、90分钟、半天线背离虽然昨天消失,但是背离条件(钝化)还在,所以背离的影响依然存在,今天上午又向下倾斜了,最近的波动节奏很快,没有规则会比较难办,所以无条件坚持规则,依然很重要。 -
波段擒龙今天 04:29:48
【2月27日周四午评】 A股三大指数早盘集体调整,截至午盘,沪指跌0.41%,深成指跌0.76%,创业板指跌1.14%,北证50指数涨1.06%。全市场半日成交额13373亿元,较上日放量1611亿元。全市场近4000只个股飘绿。今日市场出现分化,要注意前期涨幅过大的标的,会有一定的调整,而重点关注大消费和固态电池等板块。【板块分析】板块题材上,海南自贸区、固态电池、大消费板块涨幅居前;铜缆高速连接、国资云、CPO板块跌幅居前。上证指数3300-3350点的支撑比较明显,接下来有机会挑战3400点,目前市场资金在进行板块的切换,昨天提到还有智能驾驶固态电池,接下来仍旧会有一定的表现,请密切关注市场动向,今日市场出现正常的调整洗盘,注意部分标的需要及时止盈,电池相关板块有望重新启动。(以上所有观点为投顾观点,以上有关数据采摘在上交所,深交所,同花顺(sz300033),财联社,通达信等专业财经网站。不作为未来的走势依据,不作为推荐和入市依据,据此参考,盈亏自负,市场有风险,投资需谨慎, 首席投资顾问王君毅,执业证书编号:S1350620030001) -
宋谈股经今天 04:00:44
上午A股数据统计!【更多独家重磅股市观点请点击】 -
北京红竹今天 03:36:56
收摊,下午见 -
北京红竹今天 03:36:48
3、1.25万亿成交额没问题,继续保持健康的状态。上涨1280家,下跌4010家,涨停55家,跌停5家。上午黄线在下,情绪不是很好,看下午黄线是否能上来。半天内资卖出750亿,题材走弱,大消费走强,每次都是这样两者跷跷板,不让指数那么难看。AI行业出现多条利空消息,莫让AI成为操纵市场的工具,我被AI骗了!AI越强大越容易说谎,等等等。总之,这两天的市场,除非券商带动放量上涨打开空间,否则市场只有滞涨品种补涨的事。静等市场给结果吧。我的主观是滞涨品种还要继续补涨几天,跌破防守线也要等几天。但我认为不行,需要市场认为。 -
北京红竹今天 03:36:44
2、突破上方空间还有一种走势,就是不跌破防守线,券商和互金放量大涨把指数打开空间,那样还能在多玩一段时间,仓位也可以从半仓提升至7成以上。昨天券商尾盘异动,今天又辟谣,不知道会不会放量。那就等市场给答案吧。人形机器人(sz300024)和DS防守线也是明确的。策略上咱们还是不变,高位股规避,滞涨股可以玩,一旦防守线跌破就别玩了。 -
北京红竹今天 03:36:39
1、不太妙这几天几大指数陆续构造出防守线,而且恒生科技指数也是不断的上移防守线。高位股筹码已经松动2个星期了,最近2个星期都是滞涨品种在补涨。今天指数有点摇摇欲坠的感觉。反正已经提前做好预感了,已经把仓位降低至半仓左右了。那就看下午吧,是否跌破吧。沪指防守线:3337点。科创50防守线:1079点。恒生科技指数防守线:5537点。目前不能确定的是滞涨品种有没有补涨结束,确实还有一批滞涨的没补涨。如果补涨的结束了,那就更能确认了,现在还是有继续补涨的需求。 -
徐小明今天 03:35:26
【盘中直播】下午见 -
宋谈股经今天 03:34:14
2月27日午间收评:创业板指半日跌超1%,大消费板块逆势走强1、市场早间震荡调整,创业板指跌超1%。固态电池概念股逆势大涨,德尔股份(sz300473)、上海洗霸(sh603200)、光华科技(sz002741)、三祥新材(sh603663)等多股涨停。食品、旅游等消费股反弹,好想你(sz002582)、庄园牧场(sz002910)、同庆楼(sh605108)、凯撒旅业(sz000796)等封板。下跌方面,铜高速连接、CPO等算力方向走弱,博创科技(sz300548)跌超10%;机器人(sz300024)概念股走低,五洲新春(sh603667)一度跌停。个股跌多涨少,沪深京三市超4000股飘绿,上午半天成交1.34万亿。午间收盘沪指跌0.41%,深成指跌0.76%,创业板跌1.14%。2、板块概念方面,固态电池、食品、旅游、零售等板块领涨;铜高速连接、CPO、算力、机器人(sz300024)等板块领跌; 3、两市共1191只个股上涨,54只个股涨停;3846只个股下跌,5只个股跌停;14只股票炸板,炸板率25%。 -
量化伏妖今天 03:33:38
【股票午评】:重回振荡区间今日早盘低开后振荡,稍有冲高后9点50分就开始下行,晚间中金与银河两公司及时澄清否认合并传言,早盘前担心昨日指数由所透支,预期今天会出现纠正,果然指数回落过程基本没有像样的抵抗,接近最低收市。技术上粘合线日线微微拐头向下,价值陡峭日线微微拐头向下。板块方面电池,乳业,海南板块,免税概念,固态电池等微涨;市场并没有切换回科技股,本身涨幅也已经不小了,国资云概念,CPO概念,EDR概念,数字哨兵,铜缆高速连接,ERP概念等跌幅靠前也正常。总体来看市场还是处于之前的振荡区间,中期行情依然有期待,只是需要继续蓄势。