当地时间1月27日,美国芯片巨头英伟达股价暴跌17%,市值跌去5900亿美元(约合人民币4.24万亿元)。这与来自中国的人工智能初创公司DeepSeek“现象级崛起”密切相关,“好用、免费、训练成本低”,DeepSeek连续多日引发了全民关注,服务器还一度卡到宕机。
![](http://n.sinaimg.cn/spider20250128/126/w800h1726/20250128/6877-f3add0a0a4b89ddbf7c5104e13677a20.jpg)
访问量激增到一度宕机
DeepSeek一夜火出圈。从昨天开始,微信朋友圈、微博等似乎全网都在讨论或者分享DeepSeek。这款突然出圈的AI模型到底是什么?和目前市面上的大模型有何不同,为何能一夜出圈,引发全民关注?
1月28日凌晨,人工智能社区Hugging Face显示,DeepSeek刚刚发布了开源多模态人工智能模型Janus-Pro,拥有10亿和70亿参数规模,仅使用128颗英伟达A100进行训练1周。
DeepSeek有多好用?一位用户表示,以往的AI大模型都是只给出结果,但是DeepSeek会给出其思考和过程,更加可信,“不论是让它写一段代码,还是进行数学运算,它会首先给出它的推理过程。比如需要先算什么,这步的步骤是什么,再算什么,这步的式子怎么列,答案是什么……这让推理逻辑变得十分清晰、有迹可循,我们也更加敢于信任AI”。
此外,它的中文表达能力十分惊喜,可以模仿许多作家的口吻来表达,“用古龙体写小说,甚至用二次元体,都可以写得很溜。以往的AI写作,看起来写得也不错,但是要么是没有感情,堆砌词藻,要么是文体别扭,缺乏灵魂。DeepSeek则细节满满。”
最重要的是,它完全免费,“能力差不多的ChatGPT,宣称免费,但实际上每月需要花费200美元才能完全使用!”用户表示。
1月27日,苹果App Store中国区免费榜显示,DeepSeek站上首位。同时,DeepSeek在美区苹果App Store免费榜从昨日的第六位飚升至第一位,超越ChatGPT及Meta公司旗下的社交媒体平台Threads,以及Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。
不过随后,不少用户表示,系统出现了短时闪崩现象。对此,DeepSeek回应称,当天下午确实出现了局部服务波动,但问题在数分钟内就得到了解决。此次事件可能是由于新模型发布后,用户访问量激增,服务器一时无法满足大量用户的并发需求。
![](http://n.sinaimg.cn/spider20250128/170/w800h1770/20250128/6e49-eb68e197a43e9c4f0066a7d981e65676.jpg)
DeepSeek厉害在哪儿
除了体验更好,对于资本市场来说,DeepSeek更大的惊喜来自于它的推理成本大幅降低。有数据显示,最新版的推理大模型DeepSeek-R1,输入token定价为0.55美元/百万(OpenAI为15美元/百万),输出token为2.19美元/百万(OpenAI为60美元/百万),成本降低超90%。而此前DeepSeek-V3仅用550万元研发成本、2000张显卡打造,却达到与Llama 3 405B相媲美的性能,而OpenAI为了实现这一目标,花费了数亿美元。
为何可以做到这样的低成本训练?据介绍,DeepSeek通过创新架构,节省了大量的显存,进而实现底层算力的高效利用,以更低的成本训练出更加出色的模型效果;同时,研发团队证明,多Token预测目标有利于提高模型性能,可以用于推理加速的推测解码。此外,DeepSeek V3引入了一种创新方法,将推理能力从长思维链模型,蒸馏到标准模型上,在显著提高推理性能的同时,可以进行长度控制。
“DeepSeek颠覆了之前大模型公司‘堆卡’的比拼。实际上近期一些大模型公司已经没有特别大的技术创新了,模型的能力提升来自于不断堆卡、堆卡,这只利好英伟达,可以说挖矿的人没有赚到钱,卖铲子的盆满钵满……而DeepSeek击碎了模型性能与GPU数量成正比的估值模式,对整个大模型系统是一次价值重估”,一位分析人士表示。
面壁智能首席科学家刘知远在朋友圈发文称,“DeepSeek最近出圈,特别好地证明了我们的竞争优势所在,就是通过有限资源的极致高效利用,实现以少胜多。2024年很多人来问我,中国跟美国的AI差距是扩大了还是缩小了,我说明显缩小了,但能感受到大部分人还不太信服,现在DeepSeek等用实例让大家看到了这点,非常赞。”
英伟达等美股科技公司市值暴跌
资本市场迅速做出反应:英伟达公司股票27日以每股124.80美元开盘,大幅下跌12.49%,此后跌幅持续扩大,收盘时下跌16.97%,市值蒸发约5900亿美元,创下美国上市公司单日市值损失的纪录。此外,博通公司股价盘中跌幅一度接近20%,收盘时下跌17.4%。截至收盘,纳斯达克综合指数下跌612.47点,收于19341.83点,跌幅为3.07%。其他主要股指中,科技板块同样领跌。
对此,英伟达公开回应称:“DeepSeek是一项卓越的人工智能进展,也是测试时扩展的绝佳范例。DeepSeek的研究展示了如何运用该技术,借助广泛可用的模型以及完全符合出口管制规定的算力,创建新模型。”
“神秘的东方力量”从未对外融资
对于DeepSeek爆火,85后创始人梁文锋回应:中国AI不可能永远跟随。
DeepSeek是杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月。公司由知名量化资管巨头幻方量化创立。公司创始人梁文锋,本科、研究生毕业于浙江大学,拥有信息与电子工程学系本科和硕士学位。2008年起,他开始带领团队使用机器学习等技术探索全自动量化交易。2023年,进军通用人工智能领域。
公开信息显示,该团队“小而精”,只有100多人,与之相比,OpenAI有1200名研究人员。公司的工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,年纪也多在35岁以下。梁文锋曾表示,“招聘看能力,而不是看经验。我们的核心技术岗位,基本以应届和毕业一两年的人为主。”
值得注意的是,目前该公司从未对外融资。“我们跟了这家公司一年多了,一直想要进入,但是对方根本没有融资诉求”,国内一家大型资本机构负责人告诉北青报记者,“他们公司此前是做量化的,资金实力雄厚。”梁文锋也曾公开表示,“短期内没有融资计划”,并认为当下面临的问题“从来不是钱,而是高端芯片(短缺)”。
在被称为“神秘的东方力量”的DeepSeek火了之后,据称,Meta内部甚至成立了专门的研究小组,试图剖析DeepSeek的技术细节,以改进其Llama系列模型,并且新年计划中预算4000亿起步投资AI,年底AI算力将达130万卡。OpenAI也紧急透露新模型o3-mini即将免费上线ChatGPT的消息。
业内人士表示,关于AI大模型竞争仍然激烈,AI应用的创新和提升空间仍然很大,尤其是在面临算力限制的现实情况下,未来国内外的大模型市场格局还将不断变化与重塑。
文/北京青年报记者 温婧
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
APP专享直播
热门推荐
男子用DeepSeek买彩票中奖引热议,网友:倒亏5块钱!中国体彩:再强大的AI也无法预测中奖号码! 收起男子用DeepSeek买彩票中奖引热议,网友:倒亏5块钱!中国体彩:再强大的AI也无法预测中奖号码!
- 2025年02月12日
- 13:29
- APP专享
- 扒圈小记
4,598
春晚人形机器人开售即下架?宇树科技回应
- 2025年02月13日
- 02:51
- APP专享
- 扒圈小记
1,767
43岁女子酒吧找00后男模,3个月花光450万公款!被抓后她说……
- 2025年02月13日
- 06:27
- APP专享
- 北京时间
1,728
![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 13:53:41
1、据网络平台数据,电影《哪吒之魔童闹海》总票房(含预售)已达到100亿元,成为中国影史上首部票房达到100亿元的电影。2、阿里巴巴联合创始人、董事局主席蔡崇信确认阿里与苹果合作,此前有报道称,苹果和阿里巴巴将合作为中国iPhone用户开发AI功能。据The Information报道,苹果仍继续与百度合作在中国为iPhone开发AI功能,以此分散风险。3、央行发布货币政策执行报告称,下一阶段,实施好适度宽松的货币政策。根据国内外经济金融形势和金融市场运行情况 择机调整优化政策力度和节奏。4、上海市发改委发布消息,延续实施免费申领新能源汽车牌照额度政策到2025年底,大力促进汽车更新消费。5、国家发改委郑栅洁表示,加力扩围实施“两新”政策,重点支持企业更新高端化、绿色化、智能化设备,扩大消费品以旧换新范围。6、7天5板光线传媒(sz300251):出品、发行的影片《哪吒之魔童闹海》正在热映中。7连板梦网科技(sz002123):公司与DeepSeek系统的开发、应用等核心技术无关。中国电信(sh601728):2月20日占公司总股本的62.7%的限售股锁定期届满并上市流通。7连板杭钢股份(sh600126):算力业务占比极小 不涉及算力核心技术的研发等。 -
趋势领涨今天 13:47:03
A股跌了一天,盘后央妈就发声呵护了:1、实施好适度宽松的货币政策,保持流动性充裕;2、把促进物价合理回升作为把握货币政策的重要考量。现在重点是央行什么时候降准?因为美联储降息预期降低,央行近期降准的概率不大! -
趋势领涨今天 11:35:14
【“惠“聚元宵】乐享头彩!即日起《潜伏擒牛》VIP课程全场六折,半年VIP课程低至881元/月;更有月课1088元/月,季课6折3088元/三个月。活动过后价格会提升,切勿错过!加入至尊擒牛VIP:享四大顶级服务 【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每日一份高端内部绝密文章:包含明日布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!赶紧戳,直接购买:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 11:34:23
华友钴业(sh603799)公告称,公司控股股东华友控股拟自本公告披露之日起1年内,通过上海证券交易所交易系统以集中竞价交易方式增持公司A股股份,增持总金额不低于人民币3亿元,不超过人民币6亿元。增持计划不触及要约收购,不会导致公司控股股东及实际控制人发生变化。 -
趋势领涨今天 10:36:30
【天成自控(sh603085):与广东高域签订战略合作协议 围绕eVTOL等方面开展战略合作】天成自控(sh603085)公告称,公司控股子公司广东天成与广东高域签订《战略合作协议》,双方将基于各自优势资源,共同围绕电动垂直起降飞行器(eVTOL)零部件及材料在技术研发和产品量产等方面开展战略合作。 -
数字江恩今天 09:49:26
最后,这里的c延伸,哪怕延伸也是末端了。不跌破支撑,还可以有时间,但今日高点之上的空间并不大。要控制仓位,而不是肆意重仓了。 -
数字江恩今天 09:49:21
图上的红线,是绿色方框震荡中最后一个低点,和绿色方框最低点,构成了回踩的两道防线。若不跌破红线则表示震荡很强,反之跌破绿色方框最低点则代表昨日拉高是诱多。明日核心是防御,只要回踩不跌破支撑位,那么震荡后下周还要再起一轮。 -
数字江恩今天 09:49:10
昨日已经明确了,拉起为延伸结构,延伸结构主要是看支撑,这里便看1分钟图。图上的绿色方框是之前3300-3330的主体震荡区间,昨日尾盘拉起来之后,今天构造了1分钟级别的顶背离,这也是尾盘下跌的原因。【更多独家重磅股市观点请点击】 -
数字江恩今天 09:48:59
板块来看,今天出现了非常明显的变化。前期强势的deepseek概念、机器人(sz300024)概念今日都出现了较为明显的回踩,部分高位股还跌幅较大。而低位的传媒、酿酒、农林牧渔、地产建筑建材、金融却轮番上涨,但能坚持全天的,也就是传媒、酿酒和农林牧渔。 -
数字江恩今天 09:48:53
A股两市今日成交7058 + 11140 = 18198 亿人民币,相比昨日放量明显。大盘窄幅横盘震荡直至尾盘略微新高后,快速杀跌,收跌14个点。个股方面,只有约20%的个股红盘,但大幅下跌个股家数不多。