![](http://n.sinaimg.cn/spider20250118/232/w660h372/20250118/25bf-40cd5ac1f17155f572b208d95281cf5b.jpg)
出品 | 虎嗅科技组
作者 | 王欣
编辑 | 苗正卿
头图 |电影《赌神》
MiniMax有点“变味儿”了?
此前,凭借海螺AI等C端产品在海外爆火的大模型厂商MiniMax,近期打出了一张“技术牌”。
1月15日,他们发布并开源新一代01系列模型(基础语言大模型 MiniMax-Text-01 和视觉多模态大模型MiniMax-VL-01)。值得注意的是,得益于创新性地大规模引入线性注意力机制,01系列模型支持最多400万个token的上下文输入。这是MiniMax在基于MoE架构的abab系列文本模型上的再度创新。
亮出底牌,似乎也回应了当下对大模型公司们的“灵魂拷问”——究竟做不做预训练?还追不追求AGI?
“这个模型的结构是独特、创新的,只能是靠自己预训练来的。”MiniMax这样对虎嗅表示。换言之,MiniMax目前依然坚持预训练的投入。
MiniMax向虎嗅透露,未来他们的技术迭代方向为:“短期来看,把复杂coding的基础能力逐渐完善;长期来说,我们把包含多模态的agent能力做好。”
而回到MiniMax出发的原点,在2021年9月MiniMax成立前的白板前,创始人闫俊杰就清晰地列下了未来的愿景:下一代AI、接近图灵测试的智能体、智能创造极致体验。为了让员工有更具像化的感受,他还在当场与《底特律·变人》、“贾维斯”等经典IP作为对比。
即便三年后,Scaling Law 撞墙、AGI信仰面临重构,但闫俊杰坚信MiniMax会一直在浪潮中,并把技术迭代作为最重要的目标。。
实际上,虽然最初凭借Glow、星野等C端产品出圈,但MiniMax团队素来认为自己的的技术底色浓重。
此前虎嗅与MiniMax交流时,对方就强调“对我们公司来讲,我们肯定是先做技术上的东西。技术模型能够提供什么样的能力,我们再看自己的产品可不可以调整。如果实在调整不了,那有可能会有新的APP出来。”
而更重要的是,他们认为“通用基础大模型才是这一波大模型浪潮的王道。”
因此不难理解,在其他友商选择追求现实主义路线、转投新赛道时,MiniMax却选择继续重投基础模型架构的创新。
曾经,AI学术界不断迭代升级的技术路线就像接力赛,每隔一年或半年总会有更好的模型涌现。1998年,杨立昆提出了多层CNN卷积神经网络;2016年,最流行的是RNN循环神经网络的变种——LSTM;半年后,与其对标的Transformer横空出世。然而,人们预想的能够颠覆Transformer架构的新模型并没有出现。
而Transformer架构的局限性也满足不了一些应用场景的要求——例如,在生成长文本时,传统Transformer架构可能会丧失上下文的连贯性,尤其是当输入文本较长且模型只关注局部上下文时。生成的文本可能缺乏一致性,或者前后内容有明显的脱节,无法满足一些对文本连贯性要求较高的应用场景,比如对长上下文能力与多模态处理能力要求较高的Agent场景。
因此,MiniMax引入了线性注意力机制,这有利于解决传统Transformer架构下长文本计算复杂度高、上下文理解受限、内存消耗大的问题。通过这一架构创新,他们实现了400万token的上下文处理能力。作为对比,此前GPT-4o、Claude-3.5-Sonnet的相关能力大约在100k水平左右。
受益于Linear Attention层面的架构创新、算力层面的优化,以及集群上的训推一体的设计,使得01系列模型定价也被团队视为竞争力之一——标准定价是输入token 1元/百万token,输出token 8元/百万token。这里我们可以以Deepseek v3的定价对比,Deepseek v3 API 服务定价为,输入2 元 / 百万token,输出8 元/ 百万token。
相对而言,DeepSeek的新架构降低成本上表现突出,并且主要面向大集群训练、部署服务,用云提供用户服务的极致优化。而MiniMax的新架构,在超长文本输入方面表现优异,在400万的大海捞针任务(测试超长文本的任务)表现中取得全绿结果。
MiniMax观察到,“未来一年潜在Agent相关应用即将爆发,而Agent需要越来越长的context”,因此MiniMax在Github上开源了Text-01模型和VL-01模型的完整权重,在海外受到了硅谷研究员、从业者的关注。他们认为这将吸引大量的开发者和研究人员进行二次开发和创新,进一步拓展模型的应用场景和功能。
MiniMax的slogan是与用户共创智能。
虽然MiniMax认为“不是用户越多,模型能力就提升越快”,但据MiniMax介绍“他们是国内日处理量、交互时长最高的大模型公司。”随着产品矩阵的完善,早在去年8月时,MiniMax大模型每日与全球用户的交互次数达到了30亿次。
技术驱动,以模型技术能力边界调整产品方向的路线,贯穿MiniMax的始终。
这里可以以MiniMax的产品更迭为例,MiniMax每代产品和功能的推出背后,都吻合了当时的模型能力边界。
彼时,大模型普遍面临幻觉严重的问题,在这一瓶颈下,AI社区类APP无疑是当时AI to C产品炙手可热的方向。据Sensor Tower数据显示,自发布以来,海外版星野Talkie一直位居全球AI应用下载量的前3名。
随着模型能力提升,使得AI生产力成为可能,MiniMax推出了工具类产品海螺AI,并将其作为公司重点发力的产品。
MiniMax也早早押注了多模态赛道。2024年8月份,MiniMax发布了视频模型abab-video-1、音乐模型abab-music-1,同时在海螺AI上线。据MiniMax介绍,视频模型上线后五周,海螺AI网页版访问量增速超800%。
除C端应用外,MiniMax也在探索B端应用,面向企业客户提供大模型应用解决方案。MiniMax开放平台主要提供API服务,支持的行业场景涵盖了办公协作、智能制造、数字经济、医疗、客服、智能网联。他们在算力层的部署达到了万卡级算力池。据MiniMax介绍,开放平台在国内拥有超40000家企业与开发者用户,并在海外20余个国家实现业务落地。
而最新推出的01系列模型,也已经应用于海螺AI,MiniMax也观察到,在模型应用于海螺AI后,“赋予了海螺AI更强的通用能力,包括长文的理解和创作等。”
除此之外,MiniMax-01也在开放平台也同步上线,方便开发者和企业集成到自己的系统中。
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
![](http://img.t.sinajs.cn/t5/style/images/face/male_180.png)
APP专享直播
热门推荐
61岁乘客在飞机上昏迷抢救无效死亡 航司回应 收起61岁乘客在飞机上昏迷抢救无效死亡 航司回应
- 2025年02月16日
- 14:00
- APP专享
- 扒圈小记
82,977
法国小伙带622张日军侵华照片抵达北京,希望捐赠给中国
- 2025年02月16日
- 13:38
- APP专享
- 扒圈小记
21,364
人民热评:重庆燃气事件,不要每次都以道歉收场
- 2025年02月16日
- 13:58
- APP专享
- 北京时间
6,218
![新浪财经公众号 新浪财经公众号](http://n.sinaimg.cn/finance/72219a70/20180103/_thumb_23666.png)
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
宋谈股经今天 07:23:15
2月17日收评:三大指数小幅上涨,机器人(sz300024)概念股午后爆发1、沪指全天窄幅震荡,创业板指冲高回落。AI医疗概念持续走强,泓博医药(sz301230)、安必平(sh688393)、塞力医疗(sh603716)、美年健康(sz002044)、贝瑞基因(sz000710)等多股涨停。机器人(sz300024)概念股午后爆发,长盛轴承(sz300718)、新时达(sz002527)、泰豪科技(sh600590)、捷昌驱动(sh603583)、浙江荣泰(sh603119)等多股封板。腾讯云概念走强,数据港(sh603881)、云赛智联(sh600602)、东华软件(sz002065)、科华数据(sz002335)、世纪恒通(sz301428)等涨停。下跌方面,影视股集体调整,横店影视(sh603103)跌停,光线传媒(sz300251)、华策影视(sz300133)跌超10%。个股涨多跌少,沪深京三市超3600股飘红,今日成交1.97万亿。截止收盘沪指涨0.27%,深成指涨0.39%,创业板指涨0.51%。2、板块概念方面,AI医疗、AI教育、机器人(sz300024)、液冷服务器等板块涨幅居前,黄金、影视传媒、锂矿、民航机场等板块跌幅居前。3、两市共3464只个股上涨,112只个股涨停,1551只个股下跌,7只个股跌停,51只股票炸板,炸板率31%。 -
波段擒龙今天 07:10:37
A股今日三大指数集体上涨,截至收盘,沪指涨0.27%,深成指涨0.39%,创业板指涨0.51%,北证50指数涨1.76%。全市场成交额19718亿元,较上日放量2270亿元。全市场超3600只个股上涨。板块题材上,AI教育、医疗等应用、机器人(sz300024)、农业、AMC、CPO概念股涨幅居前;影视院线、有色金属、机场航运、银行板块跌幅居前。 -
徐小明今天 07:07:11
【盘中直播】语音课见 -
徐善武今天 07:05:34
上证指数今天午后出现了一波回落,但是又很快拉回来,最后基本上以全天最高点位收盘,大盘进入到去年10月后的震荡箱体,这个位置我们前面也一直在强调,压力区间震荡会加大,同时,市场会在震荡中完成洗盘,全天成交超19000亿,量能持续的放大,也给了市场一定的赚钱效应。两市上涨股票超3600家,指数不强但是个股表现比较强,在此之前,A股已经连续四天题材个股是跌多涨少的,空方情绪其实已经得到过宣泄了,量能相比上周五同期放大近2300亿,这般爆量但指数却没有作为,唯一的解释就是近期的获利盘开始加速兑现了,只要今天能稳的住,明天的危险就会小很多。赛道板块方面,主线人工智能终究没能延续上周火上浇油的走势,从分歧正式走入退潮期,就连从低位开始承接的Ai医疗也有点撑不住,说明这不是一个方向在退潮,而是超短情绪的整体退潮,接下来大家要有意识地去回避高标。【更多独家重磅股市观点请点击】 -
巨丰投资张翠霞今天 07:03:29
4小时运行结束,总结全天市场运行,1)指数高开低走补缺后,尾盘震荡回升,延续去年9月份行情规律,周五周一上涨,盘口看个股轮动加大,下半月关注两会政策预期,以及科技方向;2)量能,沪深两市今日成交额19718亿元,较上个交易日17448亿元增加2270亿元;3)行业板块方面,以加权涨幅来看56家行业39家红盘,电信运营、通用机械、通信设备等板块涨幅居前;传媒娱乐、有色、煤炭等板块跌幅居前;4)市场延续结构型行情,题材热点快速轮动。详细解盘,可关注《翠霞首席课》的“热点直击”和“操盘指南”~~~ -
趋势起航今天 07:03:06
沪指全天窄幅震荡,创业板指冲高回落。AI医疗概念持续走强,泓博医药(sz301230)、安必平(sh688393)、塞力医疗(sh603716)、美年健康(sz002044)、贝瑞基因(sz000710)等多股涨停。机器人(sz300024)概念股午后爆发,长盛轴承(sz300718)、新时达(sz002527)、泰豪科技(sh600590)、捷昌驱动(sh603583)、浙江荣泰(sh603119)等多股封板。腾讯云概念走强,数据港(sh603881)、云赛智联(sh600602)、东华软件(sz002065)、科华数据(sz002335)、世纪恒通(sz301428)等涨停。下跌方面,影视股集体调整,横店影视(sh603103)跌停,光线传媒(sz300251)、华策影视(sz300133)跌超10%。个股涨多跌少,沪深京三市超3600股飘红,今日成交1.97万亿。截止收盘沪指涨0.27%,深成指涨0.39%,创业板指涨0.51%。 -
趋势领涨今天 07:02:10
最后两天!!!最后两天!!!最后两天!!!【“惠“聚元宵】乐享头彩!即日起《潜伏擒牛》VIP课程全场六折,半年VIP课程低至881元/月;更有月课1088元/月,季课6折3088元/三个月。活动过后价格会提升,切勿错过!加入至尊擒牛VIP:享四大顶级服务 【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每日一份高端内部绝密文章:包含明日布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!赶紧戳,直接购买:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 07:01:33
周末关于微信与DeepSeep合作的消息又被吹上天,但今天DeepSeep概念出现了冲高回落,盘中板块指数大涨超过3%,但下午板块指数出现了翻绿,尾盘虽然回升了,但反弹力度已经大不如前,很多个股收出了较长的上影线,说明这个板块应该要开始调整了,取而代之的是前期连续调整的是人形机器人(sz300024)和CPO概念开始启动,说明市场热点还在科技股,只是前期大涨的个股,大家还是要注意风险,DeepSeep的行情虽然没有结束,但短期涨幅也确实太大了,等调整以后的机会吧。周末被吹爆的光线传媒(sz300251),开盘就快速上行,1分钟冲到涨停,但随后立马开板,股价快速跳水并翻绿,盘中砸到跌停,5分钟内近乎上演“天地板”,振幅达39.85%,半天量能超过前期全天量能,真的很考验大家的心脏!截止目前,《哪吒之魔童闹海》累计票房已超过119亿元,已经达到了巅峰,后期还能有多大空间呢?所以,今天光线传媒(sz300251)出现巨震是非常正常的,光线传媒(sz300251)股价巨震,带下了整个影视传媒板块,华策影视(sz300133)盘中跌幅一度超过11%,万达电影(sz002739)盘中跌幅超过8%。传媒板块的炒作,大概要告一段落了!今天内资继续大幅流出超过360亿元,重点是前三个交易日已经流出近1500亿元,今天继续大幅流出,这帮渣男每天除了砸盘还是砸盘!但好现象就是今天大盘继续放量,所以,大盘问题不大,先看3400点附近吧。有人说,现在个股跟大盘关系不大,这点我们还是非常赞同的,但大盘方向可以决定你的仓位,如果大盘要调整,你当然不能重仓,至于你持有什么个股,那就是你的事情!今天经典解盘:11:25 上午大盘在周末利好消息刺激下,两市大盘冲高回落,主要原因还是内资砸盘,内资近期一直在大幅流出,不知道这帮垃圾在怕什么?但今天大盘量能有所放大,这是一个好现象,所以,我们认为下午大盘还有反弹,整体可以考虑继续持股待涨。13:01 下午大盘应该会有回升,高点看早盘高点附近。 -
趋势领涨今天 07:01:25
内资砸盘 热点切换 大盘会大跌吗今天大盘在周末利好消息刺激下,两市大盘高开低走,开盘点位基本是全天最高点,沪市最低回踩3333点附近,这个点位有点像豹子底,随后两市大盘开始逐步回升,沪市最终突破了早盘的高点,以上涨报收,盘面上,两市个股跌多涨少,稀缺资源、短剧游戏、知识产权、钴金属、镍金属、Sora概念、锂矿等板块跌幅靠前;AI医疗、种业、人形机器人(sz300024)、CPO概念、粮食概念、铜缆高速连接、减速器、数据中心等板块涨幅靠前,两市近150只个股涨停,超过10只个股跌停,创业板走势与主板基本同步。A股有千年不变的规律,每次都想大干一场的时候,结果都你被市场大干了,周末利好原来是骗炮的!其实,每个周末出利好的时候,周一大盘基本都是高开低走的,主要原因就是量化收割和内资砸盘。虽然平时量化没有时间调整程序,但如果周末出现利好,量化是有足够的时间调整程序的,所以,以后大家千万要记住,周末出利好,周一高开就是逃跑的时候,这一点在A股市场屡试不爽!今天走势最强的是AI医疗概念,板块盘中涨幅一度超过7%,安必平(sh688393)“20cm”涨停,泓博医药(sz301230)、迪安诊断(sz300244)、思创医惠(sz300078)、祥生医疗(sh688358)、超研股份(sz301602)等多股盘中涨幅超过10%,DeepSeek使得AI技术下游应用场景不断拓展,在医疗健康领域,AI广泛应用于辅助诊断、个性化治疗、药物研发等方面,提升诊断的精度和治疗效果。AI医疗的规模持续增长,预期在2028年达到1598亿元,2022年—2028年间的年复合增长率为10.5%,刺激了这这个板块连续走强,但这个板块近期涨幅比较大了,大家追涨还需谨慎。 -
量化伏妖今天 07:00:50
【股票收评】:谨慎做多今天盘面呈现出高开振荡,盘中上下振荡幅度基本上还算正常,下午13点25分出现过一波快速回落,最低3333点,之后逐步回升,14点15分指数再次翻红。技术指标粘合线日线上行减缓,粘合线周线金叉第二周,价值陡峭日线微微拐头向下,价值陡峭周线继续上行,综合来看技术继续支撑大盘上行,只是今天指数上行的的幅度没有周末市场大多数人预期的好。板块方面AI制药,同步磁阻电机,教育,发电机概念,液冷概念,人形机器人(sz300024)等板块涨幅靠前;贵金属,能源金属,短剧互动游戏,文化传媒,AI语料,黄金概念等跌幅靠前。总体尾盘有惊无险的拉回指数,市场还是在多方控制中,谨慎做多符合目前市场氛围。