转自:上观新闻
![](http://n.sinaimg.cn/spider20250129/200/w640h360/20250129/3f4f-24f2671440ef79083355e7b32c5fef62.jpg)
![](http://n.sinaimg.cn/spider20250129/740/w640h100/20250129/9bfe-8f219c22e4ef2fe893b99c33be7486ff.png)
DeepSeek在蛇年新春给全球科技圈带来的冲击波,丝毫不亚于两年前ChatGPT横空出世带来的震撼。
而这一次,“冲击波”来自中国。
1月20日,DeepSeek发布了性能对标OpenAI-o1正式版的新模型——DeepSeek-R1,仅用1周,Deepseek应用就同时登顶苹果中国地区和美国地区应用商店免费App下载排行榜。除夕夜,它又发布了多模态大模型Janus-Pro,成为其一个月内发布的第三款大模型。
有意思的是,DeepSeek成立至今只有1年多,仍算是一家创业型公司。这股称为“来自东方的神秘力量”何以震动全球科创圈?多位专家认为,它最大的价值在于以极低的训练成本实现了可媲美甚至超越全球顶尖大模型的性能,而在此基础上的模式之变、开源之变,都将为人工智能的发展带来积极的意义。
“击穿”关键变量,打破算力神话
如果只用一个关键词来形容DeepSeek给全球科技圈带来的冲击力,多位专家都给出了一个词——成本。事实上,ChatGPT自问世以来,围绕它最大的争议在于居高不下的成本,由巨量芯片堆叠以及巨大电力消耗换来的大算力,是否真的能支持大模型长远发展?
Deepseek在成本这一关键变量上给出了“暴击”。据了解,DeepSeek-R1模型训练成本仅为560万美元,远低于美国开放人工智能研究中心、谷歌等科技巨头的技术投入成本。有人做了个比喻:如果把研发大模型比作烧开水,把对算力的投资比作烧水用的燃料,那么OpenAI烧开一壶水用了一车煤,谷歌用了一车98号汽油,马斯克用了一车航空煤油,发现壶里的水才冒泡,而创业型公司DeepSeek点燃几根火柴,就烧开了一壶水。
成本的骤降,往往会引发整个商业逻辑的变化:算力固然重要,但如果一款大模型可以花更少的钱,得出同样的解决方案,那么依靠重度氪金“外挂装备”成就大算力的逻辑就被打破了。事实上,美股市场已经给出了“投票”:除夕前一个美股交易日,包括英伟达、谷歌、微软3家公司一夜蒸发了7625亿美元的市值,约合5.5万亿人民币。虽然美股涨跌与DeepSeek不能完全划上等号,但市场的摇摆已经相当明显。
美银证券分析师Justin Post在报告中就认为,成本的降低将大大加速大模型的商业应用:“如果模型训练成本被证明可以显著降低,我们预计使用云人工智能服务的广告、旅游和其他消费应用的公司将在短期内获得成本效益。”
重构AI叙事,闯出特色本土模式
如果把成本作为透视大模型发展的一个基点,往上看,成本骤减将对未来的商业模式带来深远影响;而往下看,它更重要的意义在于蹚出一条大模型的本土发展模式。
此前,有网友尝试让DeepSeek写一篇“玄武门之变后李世民内心独白戏”,在思考8秒之后,DeepSeek写下的700多字刷屏朋友圈。它的惊艳之处在于,一方面具备对历史背景的深度把握,另一方面在文字对仗、渲染等文学上的造诣极深。而如果你用过 DeepSeek还会发现,它在给出回答之前,还给出了思考的过程——这与ChatGPT直接给出结果的底层逻辑完全不同。
浙江大学计算机博士傅聪解读认为,DeepSeek-R1的模型使用强化学习技术进行“后训练”,让模型的推理能力得到了极大的提升。简单地说,就是通过学习CoT(思维链)的方式,一步一步推理得出结果,而不是直接预测答案。而Deepseek用极快的速度,验证了这一路径的可行性。
除了新训练方法,DeepSeek还有不少变化,比如开源、深度联网等。目前R1是少数支持联网的推理模型,不少用户认为,其在大语言模型(LLM)上更卓越的表现,大概率与其支持联网搜索有关。而DeepSeek的完全开源策略,促进了AI开发者社区的协作生态,硅谷顶级风投a16z创始人马克·安德森(Marc Andreeseen)对此评论认为,DeepSeek的开源“是给世界的一份意义深远的礼物”。
数字产业分析师郝智伟认为,DeepSeek“低成本+新训练方法+开源+联网”的新模式,从某种程度上重构了AI大模型的叙事语言,走出了与海外不同的实用主义道路,也让用户与高阶AI对话的门槛大大降低,加快国产大模型的普及速度。
弯道超车,对中国科创圈启示几何
前谷歌首席执行官埃里克·施密特(Eric Schmidt)周二在一篇专栏文章表示,DeepSeek的崛起标志着全球人工智能竞赛的“转折点”。或许,DeepSeek的“蝴蝶效应”才刚刚开始,但它对中国科创圈的意义更加重大。
回到DeepSeek的诞生背景,这是一家中国创业型企业,尽管其拥有上万张中高端算力卡的较好条件,但与中国绝大多数的科技企业一样,存在高性能芯片不足、资金条件有限的客观局限性,这意味着,通过堆叠高端硬件“大力出奇迹”的方式走不通,必须在有限算力的基础上进行架构、算法、数据利用等内功的探索创新。DeepSeek的成功有其独特性,但它也同时证明了一件事:高效率低成本的本土模式是能走通的,为2025年国内大模型的发展开了个好头。
郝智伟认为,这一趋势在2024年已经有所体现,特别是大模型深度用户和创业者明显感觉到,国内的大模型更懂他们这个群体,无论是文生文的豆包、Kimi,图生视频的即梦、可灵,还是声音生成的海螺AI,这些国产AI系统都有不俗的表现。他认为,中国在“从0到1”的破局上,或许错过了大模型最初的爆发红利,但并不代表不能在“从1到100”的阶段异军突起,大模型的比拼注定是一场马拉松。
正如DeepSeek创始人梁文锋此前接受媒体采访时所说:“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现。但在这一波浪潮里,我们的出发点是走到技术的前沿,去推动整个生态发展。”
就在除夕夜,Deepseek再度发布了多模态大模型Janus-Pro,以“四两拨千斤”的模式,在文生图领域扮演了一条搅动全球科技圈的鲶鱼。
栏目主编:戎兵 文字编辑:张懿
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
APP专享直播
热门推荐
收起![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 12:55:27
贝斯特(sz300580)近日在接受调研时表示,为顺应市场发展趋势,公司将充分发挥“精密加工为特长、铸造产业为支撑、智能装备为驱动”的产业联动发展的核心竞争优势,构建三梯次产业发展战略:第一梯次产业,持续做实做强原有业务,并向增程式、混动汽车零部件拓展,夯实巩固公司业务基本盘;第二梯次产业,结合先发优势,定位电动汽车、氢燃料以及天然气燃料汽车核心零部件,夯实向新能源汽车零部件赛道的转型升级;第三梯次产业,充分利用现有资源,发挥公司竞争优势抢抓机遇,全面导入“工业母机”、“人形机器人(sz300024)”、“汽车传动”以及“自动化产业”等新赛道。 -
趋势领涨今天 11:00:54
岭南股份(sz002717)发布股价异动公告称,公司注意到网络上存在有关“公司和腾讯在人工智能、智慧文旅等领域合作”的诸多传闻。公司与腾讯之间的合作尚未取得实质性进展,也未有具体合作项目落地实施。 -
趋势领涨今天 10:56:20
最后两天!!!最后两天!!!最后两天!!!【“惠“聚元宵】乐享头彩!即日起《潜伏擒牛》VIP课程全场六折,半年VIP课程低至881元/月;更有月课1088元/月,季课6折3088元/三个月。活动过后价格会提升,切勿错过!加入至尊擒牛VIP:享四大顶级服务 【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每日一份高端内部绝密文章:包含明日布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!赶紧戳,直接购买:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 09:52:39
光线传媒(sz300251)今日高开低走大幅收跌,全天振幅近40%,天量成交超223亿元,换手率超24%。盘后数据显示,买方五个席位均为东财活跃营业部,合计买入达8.84亿元;一机构净卖出3.3亿元,深股通净卖出2.61亿元。 -
数字江恩今天 09:52:01
在c的延伸过程中,这样的个股热点还会持续不断,直至c的完成,这个时间点应该在本周。但只要未能确认c延伸结构的破坏,大盘就依然允许新高,个股也允许发挥。 -
数字江恩今天 09:51:56
看5分钟图,大盘一直处于3140反弹abc的c延伸结构之中。目前出现了图上的两个白色方框,第一个宽度30个点,第二个宽度为40个点,c目前就靠这样反复震荡向上延伸,只要第二个方框不跌破,这个延伸就还未结束。反过来说也可以,第二个方框跌破,则c确立结束。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:51:43
板块来看,ai医疗持续向上,国产算力、云、ai应用都继续表现,农林牧渔今日也表现不错。而前面持续表现的影视动漫,今天则迎来了大幅回调,周末消息发酵的金融类,今天表现也不如人意 -
数字江恩今天 09:51:39
A股两市今日成交7501 + 11914 = 19415 亿人民币,属于持续温和放量。大盘今天先震荡回踩,然后尾盘拉回,总的来说在一个不到30点的窄幅区间震荡了一个W型分时结构,收涨9个点。个股方面,约70%的个股收红。 -
数字江恩今天 09:51:34
煎熬和享受都是延伸 -
北京红竹今天 09:38:54
3、1.94万亿全天成交额将近两万亿,配合上缠论的方向,后面的吃肉行情还会继续,只是要掌握好节奏,而且还不能格局。为啥不能格局?反正我持有的品种只要大涨我就卖,因为量化都是这么干的,大涨就卖,咱手动操作干不过它,等量化卖往下砸,还不如我主动大涨就卖呢。但这么大的成交额活跃度没问题,反复的跟量化对着干就行了。目前新的方向没有出现,而且资金已经明牌,就是高低切换,那就跟随市场切滞涨的DS、人形机器人(sz300024)和铜缆就好。