![](http://n.sinaimg.cn/spider20250128/535/w1155h180/20250128/c36a-d656730915b5d68eaac7e08cdccf7f88.png)
似乎一夜之间,DeepSeek(深度求索)就“火”了。其实早些时候,这家来自杭州的人工智能基础技术研究公司在国内业内人士中就颇有口碑,近日由于其最新开源(15.110, 0.35, 2.37%)了推理模型R1正式版,不仅登顶苹果美国地区应用商店免费APP下载排行榜,在其冲击下当地时间1月27日美国人工智能主题股票遭抛售。
与此前大热的ChatGPT相比,DeepSeek的技术路线有何不同?优势在哪里?带来哪些启示?解放日报记者专访了上海交通大学人工智能学院长聘教轨副教授温颖。
【成本较低、速度较快,关键还免费】
“从大的技术路线来说,DeepSeek和OpenAI公司的ChatGPT没有特别大的区别,都是混合专家模型架构进行预训练,然后加上强化学习后训练,主要还是具体工程实现的不同。”温颖说,从最终公开榜单的效果来看,DeepSeek R1基本达到与OpenAI公司去年底发布的推理模型o1正式版相当的水平。
并没有超越OpenAI,为何会引发美国以科技公司为主的纳斯达克比较大的跌幅呢?
温颖认为,主要是因为DeepSeek推理成本较低、速度较快,关键它还对个人用户免费,其他企业或开发者调用DeepSeek-R1接口的成本也只是o1的几十分之一。
公开资料显示,DeepSeek R1的基座模型训练成本较低,一次完整训练只需要550万美元,每次生成只需要激活相对较少的参数,降低了对计算资源的需求,提高了计算效率。
温颖此前花了200美元/月订阅了OpenAI的o1 pro,“就使用感受而言,两者性能整体差不多,有些领域各有千秋。但DeepSeek R1免费,速度更快,性能真的很好。”
【开源,助力全世界技术平权和进步】
DeepSeek带来哪些启示?
“这是国内大模型第一次达到国外最顶尖大模型水准,与OpenAI的o1 pro相当,远超谷歌、Meta及国内一众大模型,把我们大模型上的技术差距从1-2年降低到3-6个月。”温颖说,DeepSeek R1模型权重和技术报告完全开源,技术路线简单有效,这对于全世界技术平权和进步都是巨大助力。
温颖一直研究强化学习,这是一种交互式学习方式,通过奖励引导模型学习推理和反思。DeepSeek R1验证了该领域一个朴素的观点,即当基座模型足够强大时,给模型一些明确且简单的奖励信号,再使用强化学习,就能让模型能力获得极大提升,涌现一些更高层次的推理和反思能力。“从学术角度看到这个观点被一定程度验证,感觉很振奋。”
其实,国内外比DeepSeek拥有更多资源的技术公司有很多,但DeepSeek能在有限的条件下大有作为,在温颖看来这得益于人才和组织效率,“凭借着一群优秀年轻人对技术的热爱,最终转化成生产力。”
原标题:DeepSeek首次比肩国外顶尖大模型,带来哪些启示?
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
APP专享直播
热门推荐
法国小伙带622张日军侵华照片抵达北京,希望捐赠给中国 收起法国小伙带622张日军侵华照片抵达北京,希望捐赠给中国
- 2025年02月16日
- 13:38
- APP专享
- 扒圈小记
21,978
人民热评:重庆燃气事件,不要每次都以道歉收场
- 2025年02月16日
- 13:58
- APP专享
- 扒圈小记
6,468
重庆燃气道歉:针对燃气收费问题已派驻整改督导专班
- 2025年02月16日
- 09:51
- APP专享
- 北京时间
3,018
![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 11:00:54
岭南股份(sz002717)发布股价异动公告称,公司注意到网络上存在有关“公司和腾讯在人工智能、智慧文旅等领域合作”的诸多传闻。公司与腾讯之间的合作尚未取得实质性进展,也未有具体合作项目落地实施。 -
趋势领涨今天 10:56:20
最后两天!!!最后两天!!!最后两天!!!【“惠“聚元宵】乐享头彩!即日起《潜伏擒牛》VIP课程全场六折,半年VIP课程低至881元/月;更有月课1088元/月,季课6折3088元/三个月。活动过后价格会提升,切勿错过!加入至尊擒牛VIP:享四大顶级服务 【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每日一份高端内部绝密文章:包含明日布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!赶紧戳,直接购买:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 09:52:39
光线传媒(sz300251)今日高开低走大幅收跌,全天振幅近40%,天量成交超223亿元,换手率超24%。盘后数据显示,买方五个席位均为东财活跃营业部,合计买入达8.84亿元;一机构净卖出3.3亿元,深股通净卖出2.61亿元。 -
数字江恩今天 09:52:01
在c的延伸过程中,这样的个股热点还会持续不断,直至c的完成,这个时间点应该在本周。但只要未能确认c延伸结构的破坏,大盘就依然允许新高,个股也允许发挥。 -
数字江恩今天 09:51:56
看5分钟图,大盘一直处于3140反弹abc的c延伸结构之中。目前出现了图上的两个白色方框,第一个宽度30个点,第二个宽度为40个点,c目前就靠这样反复震荡向上延伸,只要第二个方框不跌破,这个延伸就还未结束。反过来说也可以,第二个方框跌破,则c确立结束。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:51:43
板块来看,ai医疗持续向上,国产算力、云、ai应用都继续表现,农林牧渔今日也表现不错。而前面持续表现的影视动漫,今天则迎来了大幅回调,周末消息发酵的金融类,今天表现也不如人意 -
数字江恩今天 09:51:39
A股两市今日成交7501 + 11914 = 19415 亿人民币,属于持续温和放量。大盘今天先震荡回踩,然后尾盘拉回,总的来说在一个不到30点的窄幅区间震荡了一个W型分时结构,收涨9个点。个股方面,约70%的个股收红。 -
数字江恩今天 09:51:34
煎熬和享受都是延伸 -
北京红竹今天 09:38:54
3、1.94万亿全天成交额将近两万亿,配合上缠论的方向,后面的吃肉行情还会继续,只是要掌握好节奏,而且还不能格局。为啥不能格局?反正我持有的品种只要大涨我就卖,因为量化都是这么干的,大涨就卖,咱手动操作干不过它,等量化卖往下砸,还不如我主动大涨就卖呢。但这么大的成交额活跃度没问题,反复的跟量化对着干就行了。目前新的方向没有出现,而且资金已经明牌,就是高低切换,那就跟随市场切滞涨的DS、人形机器人(sz300024)和铜缆就好。 -
北京红竹今天 09:38:48
2、不追高春节回来之后市场很疯狂,虽然指数没有怎么大涨,但赚钱效应很高涨。恒生科技指数更是率先反转,晚上在直播间跟红竹聊天的同学,恒生科技吃了一大口肉。而沪指本周,红竹的第六感告诉我,要有一波洗盘,就在周二三之后。当然了,第六感不能当饭吃,交易上谨慎点就行了,别追高就行。缠论结构上,恒生科技指数和创业板都有防守线了,不破反弹还会继续,跌破咱就小心点洗盘。沪指我从上周就在等五分钟级别三买,到今天都没有出现。客观上要么盯好恒生科技指数和创业板的防守线,跌破就防守下,要么就等着沪指的防守线出现。