“违规蒸馏”指控!DeepSeek遭OpenAI和Anthropic围剿,AI进入“规则制高点”竞争?【附全球大模型发展现状及趋势分析】

“违规蒸馏”指控!DeepSeek遭OpenAI和Anthropic围剿,AI进入“规则制高点”竞争?【附全球大模型发展现状及趋势分析】
2025年01月31日 18:48 前瞻网
图源:摄图网图源:摄图网

近日,OpenAI告诉《金融时报》,他们发现了一些模型蒸馏的证据,他们怀疑这是DeepSeek的所作所为。目前,OpenAI拒绝进一步置评,也不愿提供证据细节。

具体来说,他们发现了DeepSeek“蒸馏”OpenAI模型的迹象。即使用更大模型的输出来提高较小模型的性能,从而以较低成本在特定任务上取得类似结果。

微软也开始调查DeepSeek是否使用OpenAI的API。

各方消息汇总来看,微软和OpenAI对DeepSeek的质疑还处于调查中。根据微软工作人员的说法,DeepSeek可能在去年秋天调用了OpenAI的API,这可能导致数据泄露。

按照OpenAI的服务条款规定,任何人都可以注册使用OpenAI的API,但是不能使用输出数据训练对OpenAI造成竞争威胁的模型。

而对于模型蒸馏,在行业内,一些开源模型的服务条款允许蒸馏。比如Llama,DeepSeek此前也在论文中表示使用了Llama。

IBM对知识蒸馏的文章中也提到,大多数情况下最领先的LLM对计算、成本提出太高要求……知识蒸馏已经成为一种重要手段,能将大模型的先进能力移植到更小的(通常是)开源模型中。因此,它已经成为生成式AI普惠化的一个重要工具。

而DeepSeek R1并非只是简单蒸馏模型,OpenAI首席科学家Mark Chen表示:DeepSeek独立发现了OpenAI在实现o1过程中所采用的一些核心理念。同时他也认可了DeepSeek在成本控制上的工作,并提到蒸馏技术的趋势,表示OpenAI也在积极探索模型压缩和优化技术,降低成本。

所以总结一下,模型蒸馏技术在学术界、工业界都非常普遍且被认可,但是违反OpenAI的服务条款。

就在OpenAI挑起矛盾的同时,Anthropic也下场了。

创始人Dario Amodei在个人博客中表达了对DeepSeek的看法。

他表示并没有把DeepSeek看做是竞争对手,认为DS最新模型的水平和他们7-10个月前相当,只是成本大幅降低。同时他还认为,DeepSeek整个公司的成本投入(非单个模型训练成本)和Anthropic的AI实验室差不多。

2024年全球大模型行业市场规模将达到280亿美元

大模型是指包含超大规模参数(通常在十亿个以上)的神经网络模型。神经网络模型则是指基于神经网络结构构成的数学模型,它受到人脑神经系统结构的启发,由人工神经元(节点)和它们之间的连接组成。这些连接具有权重,可以通过学习过程进行调整,从而使得神经网络能够学习和适应输入数据的模式。2023年全球大模型行业市场规模达到210亿美元。初步估算,2024年全球大模型行业市场规模将达到280亿美元,未来五年复合增速将达到36.23%。

区域市场

从区域市场来看,根据斯坦福大学人工智能研究所(Stanford HAI)于2024年4月发布的《2024年人工智能指数报告》,2019-2023年全球基础大模型发布累积数量中,数量最多的国家是美国,2023年美国发布了基础大模型109个,占比达69%,其次是中国和英国。

产业竞争

当前全球AI大模型行业正处于技术创新与商业化加速推进的阶段。OpenAI、Google、微软等美企处于领先地位,主导生成式AI、自然语言处理等领域,模型如GPT系列和PaLM广泛应用。Meta等公司探索开源模式,增强生态影响力。行业趋势包括模型规模扩张、多模态能力提升和垂直领域优化,但高计算成本与安全性挑战仍是主要问题。

那么DeepSeek R1的价值究竟几何?

分析师郭明錤最新博客给出参考:

一是在Scaling Law放缓的情况下,AI算力仍可透过优化训练方式持续成长,并有利挖掘新应用。

过去1-2年,投资者对AI服务器供应链的投资逻辑,主要基于AI服务器的出货量在Scaling Law依然有效的情况下可持续增长。但Scaling law的边际效益开始逐渐递减,市场开始关注以DeepSeek为代表的通过Scaling law以外的方式显著提升模型效益的路径。

第二个趋势是API/Token价格的显著下滑,有利于加速AI应用的多元化。

郭明錤认为,目前从生成式AI趋势中获利的方式,主要还是“卖铲子”和降低成本,而不是创造新业务或提升既有业务的附加值。

而DeepSeek-R1的定价策略,会带动生成式AI的整体使用成本下降,这有助于增加AI算力需求,并且可以降低投资人对AI投资能否获利的疑虑。

不过,使用量的提升程度能否抵消价格降低带来的影响,仍然有待观察。

同时,郭明錤表示,只有大量部署者才会遇到Scaling law边际效益的放缓,因此当边际效益再度加速时,英伟达将依然是赢家。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《2024-2029年全球及中国大模型产业发展前景与投资战略规划分析报告》

同时前瞻产业研究院还提供产业新赛道研究、投资可行性研究、产业规划、园区规划、产业招商、产业图谱、产业大数据、智慧招商系统、行业地位证明、IPO咨询/募投可研、专精特新小巨人申报、十五五规划等解决方案。如需转载引用本篇文章内容,请注明资料来源(前瞻产业研究院)。

更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。

海量资讯、精准解读,尽在新浪财经APP
AI
0条评论|0人参与网友评论

APP专享直播

开播时间 | 2-28 16:00
易方达基金:财经E+N
开播时间 | 2-28 16:00
广发基金:港股创新药风口再起:深度解析港股创新药投资价值
开播时间 | 2-28 16:00
光大证券李泉:市场风格切换,全面挖掘3月市场机遇
开播时间 | 2-28 15:30
国投瑞银:追上军工热点 | DeepSeek驱动军工AI加速发展?
开播时间 | 2-28 15:30
华夏基金:猫头鹰·华夏基金科技策略会
开播时间 | 2-28 14:30
建信基金:智联未来 共启新章——建信基金2025年春季投资策略会
开播时间 | 2-28 14:00
国联安基金:科技引擎全力驱动,市场机遇全解析
开播时间 | 2-28 14:00
华夏基金:车间里的黑科技:AI如何给制造领域"开外挂"?
开播时间 | 2-28 13:58
车间里的黑科技:AI如何给制造领域“开外挂”?
开播时间 | 2-28 13:30
中银基金:显著反弹!创新药行情会持续吗?
开播时间 | 2-28 16:00
易方达基金:财经E+N
开播时间 | 2-28 16:00
广发基金:港股创新药风口再起:深度解析港股创新药投资价值
开播时间 | 2-28 16:00
光大证券李泉:市场风格切换,全面挖掘3月市场机遇
开播时间 | 2-28 15:30
国投瑞银:追上军工热点 | DeepSeek驱动军工AI加速发展?
开播时间 | 2-28 15:30
华夏基金:猫头鹰·华夏基金科技策略会
开播时间 | 2-28 14:30
建信基金:智联未来 共启新章——建信基金2025年春季投资策略会
开播时间 | 2-28 14:00
国联安基金:科技引擎全力驱动,市场机遇全解析
开播时间 | 2-28 14:00
华夏基金:车间里的黑科技:AI如何给制造领域"开外挂"?
开播时间 | 2-28 13:58
车间里的黑科技:AI如何给制造领域“开外挂”?
开播时间 | 2-28 13:30
中银基金:显著反弹!创新药行情会持续吗?
上一页下一页
1/10

热门推荐

接吻时长世界纪录保持者夫妇分手,曾连续吻了58小时35分钟 收起
接吻时长世界纪录保持者夫妇分手,曾连续吻了58小时35分钟

接吻时长世界纪录保持者夫妇分手,曾连续吻了58小时35分钟

  • 2025年02月27日
  • 08:58
  • APP专享
  • 扒圈小记
  • 29,058
APP专享
微博:为避免体育极端饭圈行为波及到运动员,解散相关运动员超话

微博:为避免体育极端饭圈行为波及到运动员,解散相关运动员超话

  • 2025年02月27日
  • 15:01
  • APP专享
  • 扒圈小记
  • 9,065
APP专享
余华英被执行死刑

余华英被执行死刑

  • 2025年02月28日
  • 04:21
  • APP专享
  • 北京时间
  • 7,904
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票
广告

7X24小时

  • 01-17 宏海科技 920108 5.57
  • 01-16 亚联机械 001395 19.08
  • 01-16 海博思创 688411 19.38
  • 01-14 富岭股份 001356 5.3
  • 01-13 超研股份 301602 6.7
  • 广告
    新浪首页 语音播报 相关新闻 返回顶部
    关闭
    关闭
    关闭