春节假期,泼天流量降到了DeepSeek的头上。
大概一周多之前,DeepSeek还算不上太有名气,在大模型圈之外,外界对它可能多是一头雾水。然而短短几天,其就一跃成为业界顶流,并闯进了公众视野。
因接连推出的两款大模型产品,DeepSeek在华尔街掀起风暴,美股科技股一度重挫。周二,英伟达单日蒸发近6000亿美元市值,博通和美光科技等芯片产业链股票也纷纷大跌。虽然周三英伟达反弹涨近9%,但DeepSeek带来的心理冲击并没消散。
“DeepSeek大模型在性能上比肩ChatGpt,可能意味着国产大模型实现突破,这对美股科技股造成了冲击。”前海开源基金首席经济学家杨德龙告诉时代周报记者。在他看来,科技股是美股牛市的主要推动力,但投资者担心其估值产生巨大泡沫。若一些新技术突破或新模型不需要消耗那么多的GPU,可能会引发像英伟达等公司的大幅下跌,从而导致美股科技股泡沫破裂。
作为一家成立不到两年的大模型公司,无论在融资、技术进展还是舆论层面,DeepSeek一向都动静不大。而它背后的公司幻方量化(一家头部量化私募),在此之前也仅是在私募圈出名。出人意料的是,一家私募和一家大模型初创公司,这样的少见组合诞生了“DeepSeek神话”——无疑令人倍感好奇。
这一切是怎么做到的?
潜行多年
如果从成立时间上看,DeepSeek并无特别之处。自2022年底ChatGPT发布之后,全球科技圈震动,随之一系列国产大模型创业项目面世。DeepSeek搭乘的也是这股潮流,2023年4月,幻方量化高调宣布进军大模型,三个月之后,DeepSeek作为独立公司成立。
但脱胎于幻方量化的DeepSeek,其实技术积累要更早。
幻方量化成立于2015年,创始人是梁文锋。在该公司官网上,赫然写着的是:使用AI投资的对冲基金。按照幻方量化的披露,在公司成立之前七八年时间,创始团队就在探索将技术应用于投资交易。当时量化投资在国内尚未流行,团队成员在这方面的经验同样寥寥,出于朦胧的市场感知和技术理想,梁文锋团队仍决定走上这条路。
在这一时期,幻方量化创始团队从零开始尝试全自动交易,采用机器学习等技术。2010年是一个转折点,当年股指期货和融资融券相继推出,A股投资更活跃和多样化。一时间,量化投资在国内私募基金业逐渐增加,报道称梁文锋团队也借此收益颇丰。
2015年,幻方量化正式成立,借助AI和数学进行量化投资。2016年,幻方量化第一个由深度学习算法模型生成的股票仓位上线实盘交易,使用GPU进行计算。而在此之前,算法主要依靠线性模型和传统机器学习算法,模型计算主要依赖于CPU。
自此之后,幻方的量化策略全面AI化。到2017年底,几乎所有量化策略均已采用AI模型计算。随后不久,该公司明确宣布AI为主要发展方向。
所谓量化投资,指的是借助统计学和数学方法,利用计算机程序对大量数据进行分析,寻求获得超额收益的投资策略。在持仓风格上,量化投资倾向高度分散和多样化配置,以降低单一资产波动的风险。在决策上,不同于传统的依靠基金经理主观判断,量化公司是基于数据和模型进行交易。
全面AI化也带来某些问题,比如复杂的模型计算需求使得单机训练遭遇算力瓶颈,训练需求和有限的计算资源产生矛盾,幻方量化需要解决大规模算力的受限难题。在这个背景下,幻方量化在2019年成立了一家AI基础研究公司,并推出自研的“萤火一号”AI集群,搭载500块显卡。同一年,幻方量化规模扩张,跻身百亿私募。2021年,幻方又斥资10亿元加码建设“萤火二号”,为AI研究提供算力支持。
从事后来看,幻方量化在构建AI算力过程中的“囤卡”动作,为它赢得了市场机会。作为国内早期的英伟达芯片大买家之一,在ChatGPT爆发前夜,幻方量化手中的英伟达显卡数量就越攒越多。据幻方量化称,在2022年时,其用于科研支持的闲时算力高达1533万GPU时,这意味着每天用于科研而非交易的算力便达4.2万GPU时。这个水平,大大超越了后来的很多大模型公司。
DeepSeek,就是在这样的加持下问世。
也交过学费
幻方量化上演了一个“一朝成名天下知”的精彩故事,在它的叙事版本里,无论做金融交易还是进军大模型,都是比较纯粹的技术向追求。
一位接近幻方量化的投资人士告诉时代周报记者,他一直很关注这家公司,并且和团队成员有过交流。虽然没有直接接触过创始人本人,但能感觉出来,相对于商业盈利,这个团队的技术理想色彩是更为浓厚的。
幻方量化希望通过AI量化交易,对金融资产进行定价和投资。金融交易足够复杂,又是从起家就介入的领域,对于旨在实现通用人工智能(AGI)的幻方量化而言,这是一个非常合适的切入场景。
早在2020年,点拾投资创始人朱昂曾访谈过幻方量化CEO陆政哲。彼时陆政哲称,幻方量化将自己定义为一家完全依靠AI来做投资的对冲基金。其模型数据来源有三个,分别是行情数据、覆盖全市场的基本面数据以及经过结构化处理的另类数据。用这三类数据来训练机器模型,据此构建投资组合,再用精细化的程序化交易完成交易。
这套打法确实效果显著,在2017年-2020年间,整个量化行业高速增长,幻方量化的管理规模也水涨船高。不过,量化交易并非完美,幻方量化在这上面也吃过苦头。
2021年12月,由于业绩回撤达历史最大值,幻方量化就业绩不及格发文致歉。幻方量化称,其人工反复检视了AI的投资决策,认为AI选出来的股票从长期价值来说基本上没问题,但在买卖时点上确实做的不够好。尤其市场风格剧烈切换时,AI倾向于冒险博取更多收益,这进一步加大了回撤。
量化资管行业扩张太快,被认为是另一个原因。幻方量化认为,行业规模猛增,导致策略同质化严重,加大了整体操作的难度。因此,当时幻方量化着手控制总的规模,同时表态要加大对策略研究的投入,以重新获得市场优势。而在监管层面,2024年7月份融券业务相关政策发生重大调整,转融券业务暂停,并且融券保证金比例上调。此外,程序化交易被进一步强化监管。量化行业似乎告别一段野蛮发展期。
目前,梁文锋旗下有两家百亿私募,除了宁波幻方量化(股票策略),另外一家是浙江九章资产(多资产策略)。就业绩而言,据私募排排网数据,过去两年量化公司的风头仍然强势,如2023年百亿私募排行榜中,前十名中量化公司占据六席,在104家上榜私募中,九章资产和幻方量化的业绩分列32和33位。到2024年,量化私募的整体收益仍高于主观私募,除东方港湾(主观投资)牢牢把持行业首位之外,前三十名中量化或主观+量化的机构占据多数。不过,幻方量化的业绩同样算不上突出,仅排在第19位。
在私募排排网有业绩展示的12只产品中,幻方量化旗下产品2024年的收益均值为12.18%,收益中位数为13.02%。
“还需冷静看待”
某种程度上,DeepSeek应该是幻方量化的深度转型之作。成立之初,该公司就表示将专注在大模型上,从语言大模型到视觉大模型,再到多模态大模型,堪称步步为营。
过去一年多,从默默无闻到火爆出圈,DeepSeek经历了一条清晰的产品迭代之路。
在2024年5月之前,DeepSeek相继推出了DeepSeek Coder(免费且开源的首个模型)、DeepSeek LLM(第一个大语言模型),其中DeepSeek LLM包含670亿参数,在一个包含2万亿token(语言模型中用来表示单词或短语的符号)的数据集上进行训练。在中文表现上,该模型据称超越了当时的GPT-3.5。
这两款模型都没有引起波澜,直到随后发布的DeepSeek-V2,才让DeepSeek在圈中出名。DeepSeek-V2是混合专家(MoE)语言模型,包含总参数达到2360亿,每个token激活210亿个参数。在一些行业测试中,DeepSeek-V2有着不错的表现。
有意思的是,当时国内业界对这款模型似乎欠缺技术层面的关注。DeepSeek-V2之所以被注意到,是由于它在大模型行业掀起一场价格大战——DeepSeek在5月出宣布,DeepSeek-V2降价至每百万Tokens输入价格为1元、输出价格为2元,开发者还能获得500万Tokens的免费额度。
这个价格水平,大约相当于GPT-4 Turbo的七十分之一。
随即互联网大厂纷纷跟进,甚至不乏有厂家将价格降得比DeepSeek-V2还低。就在国内玩家为价格战打的火热时,有硅谷从业者发现,DeepSeek-V2采用的多头潜在注意力机制,有效提升了大模型的性能。
这或许是硅谷较早地正视这家中国初创公司。
据一位行业相关人士解释,多头潜在注意力机制是DeepSeek-V2提出的一种注意力架构,该架构可以显著降低推理过程中的KV缓存。所谓KV缓存,指的是在大模型的推理过程中,用于存储先前计算结果的一种技术。
到2024年底,DeepSeek继续迭代,推出了DeepSeek-V3模型。DeepSeek终于迎来它的GPT-3时刻。
今年1月20日,DeepSeek-R1发布,在数学、代码、自然语言推理等任务上,宣称性能对标OpenAI o1正式版。而它的蒸馏(将大模型的知识迁移到小模型中)小模型,也超越了OpenAI o1-mini。此外,在开源和闭源路线仍有争议的眼下,DeepSeek宣布R1开源,允许用户进行“模型蒸馏”,以促进技术共享。
DeepSeek-R1是一枚重磅炸弹,在性能上为全球业界瞩目之外,更重要的是——它的成本相比竞品大大降低。一周之后,DeepSeek趁热打铁,又推出开源多模态模型,被认为在文生图方面超越OpenAI的DALL-E3。至此,外界对DeepSeek的讨论关注,达到高潮。
与先进大模型保持相近的性能,并在训练成本、运行成本和服务定价上全面大幅下降,这是DeepSeek震撼科技圈的原因。在这样的现象级产品出现之前,过去两年多时间,由于AI业界对高性能显卡的追逐,英伟达被一路推上王座。无论在资本市场还是产业链,这个逻辑似乎已经确立,没料到DeepSeek横空出世,硬生生搅了局。
不过,这场冲击波能持续多久,还是个未知数。DeepSeek的势头固然很猛,但是否弥合了国产大模型与国际先进水平之前的技术代差,正在引发热议。另外,DeepSeek通过算法优化提升效率,是否就意味着对算力需求的明显减弱,下结论也太早。
喧闹之外,降温观察逐渐成为一种声音。“针对最近几天事情的发展,个人觉得还是冷静看待,肯定其取得的成就,但也要避免情绪化。”上述投资人士如此说道。
责任编辑:栎树


APP专享直播
热门推荐
吵架后,泽连斯基离开美国 收起吵架后,泽连斯基离开美国
- 2025年03月01日
- 14:30
- APP专享
- 扒圈小记
9,265
美总统国家安全事务助理谈“轰走”泽连斯基细节:他的大使和顾问几乎都哭了
- 2025年03月02日
- 01:32
- APP专享
- 扒圈小记
4,499
白宫争吵后,泽连斯基最新发声
- 2025年03月02日
- 04:24
- APP专享
- 北京时间
2,779

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势起航今天 13:49:29
【以总理:若与哈马斯谈判无效 将重返加沙作战】以色列总理内塔尼亚胡在每周内阁会议上表示,以色列与美国总统特朗普及其工作人员协调,提出将与巴勒斯坦伊斯兰抵抗运动(哈马斯)的停火协议第一阶段再延长50天。他表示,这是美国中东问题特使史蒂文·威特科夫在了解到双方对进入协议第二阶段立场无法达成一致后,提出的延期建议。内塔尼亚胡称,如果哈马斯同意延长第一阶段停火期限,以色列将立即开始谈判;如果确信谈判无效,以色列将被允许重返加沙作战。内塔尼亚胡还说,如果哈马斯不释放更多被扣押人员,将会产生“进一步的后果”。 -
趋势起航今天 13:19:27
【俄罗斯滨海边疆区野火蔓延 过火面积近3500公顷】俄罗斯紧急情况部当地时间3月2日发布通报称,俄罗斯滨海边疆区的纳霍德卡市和什科托沃村等地遭遇野火。在过去24小时里已记录到10起火灾,过火面积达3454公顷。火势已蔓延至公路,并向居民住宅区逼近。目前,该地区14个市镇已启动特殊防火模式,另有6个城镇进入高度戒备状态。根据俄罗斯联邦航空护林局的数据分析,滨海边疆区南部自3月起面临大规模山火风险。有关专家警告称,若防控不当,5月份火灾可能蔓延至哈巴罗夫斯克边疆区和阿穆尔州等地。 -
趋势起航今天 12:49:26
【雪浪环境(sz300385):股东杨建平、许惠芬拟减持不超过3%公司股份】雪浪环境(sz300385)(300385.SZ)公告称,合计持有公司20.29%股份的股东杨建平和许惠芬,计划自公告披露之日起15个交易日后的3个月内,通过集中竞价或大宗交易方式减持不超过9,994,300股,即不超过公司总股本的3%。减持原因为家庭资产规划。减持价格将根据市场价格确定。 -
趋势起航今天 12:19:23
【深圳:将在全市园区推行“园区贷”】深圳举行营商环境主题新闻发布会。会上介绍,深圳高度重视解决企业融资需求,向广大中小微企业创新试点“园区贷”,推动产业园区运营机构依法依规运用入驻企业的房租、水电、燃气缴纳等多维度数据为企业画像,量身打造增值增信服务。“园区贷”业务去年8月开展以来,在深圳10个园区试点,授信余额超过110亿元。接下来深圳将在全市园区推行“园区贷”,进一步改善产业园区循环生态。 (21世纪经济报道) -
趋势起航今天 11:49:22
【成都先导(sh688222):东方佳钰、深圳钧天、华博器械拟减持公司股份】《科创板日报》2日讯,成都先导(sh688222)(688222.SH)公告称,公司股东东方佳钰、深圳钧天、华博器械计划通过集中竞价交易或大宗交易的方式减持其所持有的公司股份。其中,东方佳钰拟减持不超过4,817,500股,占公司总股本的1.20%;深圳钧天拟减持不超过2,175,352股,占公司总股本的0.54%;华博器械拟减持不超过2,000,000股,占公司总股本的0.50%。减持期间为2025年3月24日至2025年6月23日。减持价格将按照市场价格进行,减持原因为自身财务需求及安排。这些股东承诺将在减持前3个交易日公告减持计划。 -
趋势起航今天 11:19:20
【中信建投(sh601066):对市场战略性看多的判断没有改变】中信建投(sh601066)研报表示,投资者情绪指数在春节后持续走高,2月7日突破75进入高涨区,在2月26—27日短暂超过90后,情绪指数在2月最后一个交易日由于市场调整跌出亢奋区。情绪指数刚刚突破90后市场即迅速迎来调整,这与去年12月12日存在一定的相似之处。当前市场总体仍然健康,唯一提示市场回调风险的指标来自换手率,这意味着月末市场的下跌主要是由短期交易过热引发的正常回调。总的来说,中信建投(sh601066)对市场战略性看多的判断没有改变,回调结束后仍然建议继续维持较高仓位水平。 -
趋势起航今天 10:49:18
吉利汽车表示将通过关连交易成立合资公司发展智能驾驶业务,吉利汽车将持有合资公司30%的股份。 -
趋势领涨今天 10:35:48
推动完善融资配套机制 下大气力解决民营企业融资难、融资贵问题;抓好“科创板八条”“服务现代化产业体系十六条”“并购六条”等政策落实落地 支持民营企业通过资本市场发展壮大。明天科创板,创业板等科技股应该有表现了! -
趋势起航今天 10:19:17
【吉利汽车:2月汽车销量20.49万辆 同比增长约84%】吉利汽车公告,2月汽车销量204910辆,较去年同期增长约84%。其中,纯电动汽车销量72203辆,插电式混动汽车销量26230辆。 -
趋势领涨今天 09:58:10
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】