发力。
作者 | 刘宝丹
编辑 | 黄昱
在经过两年的技术迭代后,2025年将是AI商业化落地的决胜之年。作为国内AI独角兽,MiniMax也开始发起冲刺了。
1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型能够高效处理高达400万token的输入,可输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。
这是全球首个大规模应用线性注意力机制架构的开源模型,背后承载的是MiniMax在技术和商业化应用方面的野心。
MiniMax成立于2021年,目前完成四轮融资,最近一次是2024年3月,由阿里领投,估值25亿美元,成为国内AI“六小龙”之一。从模型来看,MiniMax自主研发了多模态的通用大模型,其中包括万亿参数的MoE文本大模型、语音&音乐大模型等系列模型。
四个月前,在成立996天的伙伴日上,MiniMax创始人闫俊杰透露了公司商业化方面的考量。他表示,整个公司的商业化基本上分成两个形式,一个是开放平台,现在已经有两千多家的客户;第二点,在公司产品里面也有广告的机制。
彼时,MiniMax国际业务总经理盛静远表示,MiniMax现在是所有中国大模型公司里面,少数几个能讲商业化变现,能讲产品跟模型驱动,甚至很有可能能在比较短的时间内实现自负盈亏及盈利的公司。
如今,随着01系列模型的发布,MiniMax在AI大模型的商业化变现方面有望提速。
一方面,这主要是因为,新模型在输入长度方面取得了新的突破。
MiniMax-01系列模型首次将线性注意力机制(Linear Attention)扩展到商用模型的级别,这意味着,线性注意力机制从学术理论成功落地到模型应用层面。受益于此次架构创新,该系列模型在处理长输入的时候具有非常高的效率,接近线性复杂度。
从ScalingLaw、与MoE的结合、结构设计、训练优化和推理优化等层面综合考虑,MiniMax选择模型参数量为4560亿,其中每次激活459亿,能够高效处理高达400万token的上下文,将有效替代Transformer传统架构并开启超长文本输入时代。
而长文本能力是制约AI大模型商业化落地的核心元素,尤其AI Agent阶段正在加速到来,包含长文本在内的大模型性能将在市场中接受真正的考验。
2025年,AI将迎来至关重要的发展节点,AI Agent有望成为新一年最重要的产品形态,由于AI Agent处理任务变得越来越复杂,涉及的数据量也越来越大,单个智能体的记忆以及多个智能体协作间的上下文都会变得越来越长。
在这种背景下,长上下文能力与多模态处理能力的提升,是AI Agent为各行业带来更为丰富、高效、智能的解决方案的必要条件,这也是MiniMax 01系列模型的最大亮点。
价格也是影响AI大模型落地的重要因素。华尔街见闻获悉,受益于Linear Attention层面的架构创新、算力层面的优化,以及集群上的训推一体的设计,MiniMax API服务的标准定价是输入token 1元/百万token,输出token 8元/百万token。
值得一提的是,MiniMax在Github上开源了Text-01模型、VL-01模型的完整权重,以便于更多开发者做有价值、突破性的研究。
MiniMax表示,“我们认为这有可能启发更多长上下文的研究和应用,从而更快促进Agent时代的到来,二是开源也能促使我们努力做更多创新,更高质量地开展后续的模型研发工作。”
不过,MiniMax要想在商业落地上取得更大的成绩,还面临AI技术迭代带来的不确定性,作为创业公司在应用生态上的不足,以及激烈的市场竞争,这些都会给公司带来压力。
以市场竞争为例,MiniMax想要打造出AI时代的杀手级APP。根据Sensor Tower数据,截至2024年8月,Talkie在全球AI应用下载榜上位居第12位,海螺AI在国内AI应用榜单也能排到TOP10。
虽然两款产品的成绩不错,但距离遥遥领先的ChatGPT和迅速蹿升的豆包,依然有不小差距.这背后可能反应了MiniMax在产品和市场方面的能力差距。
早在ChatGPT火爆出圈之前就已成立,MiniMax被认为是最有AGI愿景的创业公司之一。过去一年,MiniMax持续深耕技术和产品,并在2025年开年放出一枚重磅武器,颇有厚积薄发之势。
接下来就看MiniMax能否在商业化这条路上开花结果,这注定是一场极为艰难的硬仗。
风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。
APP专享直播
热门推荐
俄媒:马斯克发帖,建议把“英吉利海峡”更名为“乔治·华盛顿海峡” 收起俄媒:马斯克发帖,建议把“英吉利海峡”更名为“乔治·华盛顿海峡”
- 2025年01月26日
- 13:51
- APP专享
- 记经典时刻
- 6,870
【8点见】重要犯罪嫌疑人“颜十六”到案!
- 2025年01月27日
- 00:05
- APP专享
- 记经典时刻
- 3,250
无忧前员工称张大大工作室常换人:大家不太能接受张大大的工作方式,随叫随到、贬低辱骂、非常情绪化
- 2025年01月26日
- 08:27
- APP专享
- 我是山河君
- 2,276
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 04:40:53
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
宋谈股经今天 04:02:00
上午A股数据统计!【更多独家重磅股市观点请点击】 -
徐小明今天 03:41:38
【盘中直播】下午见 -
徐小明今天 03:41:08
【盘中直播】我们在交易生涯里,遇到各种情况,竞争无所谓环境,坚持做好自己 -
宋谈股经今天 03:37:39
DeepSeek回应“宕机”原因:可能和服务维护、请求限制等因素有关!今天有消息称DeepSeek服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。昨日(26日),DeepSeek曾出现短时闪崩现象。对于DeepSeek网页/API不可用的原因,DeepSeek回应称,可能和服务维护、请求限制等因素有关。(新浪科技) -
宋谈股经今天 03:35:13
1月27日午间收评:创业板指半日跌1.55%,算力硬件股集体走弱1、大小指数早间走势分化,沪指维持红盘震荡,创业板指跌超1.5%。DeepSeek概念股大涨,每日互动(sz300766)、航锦科技(sz000818)、美格智能(sz002881)涨停。AI智能体概念继续活跃,新炬网络(sh605398)、视觉中国(sz000681)、垒知集团(sz002398)、泛微网络(sh603039)涨停。下跌方面,算力硬件股全线调整,天孚通信(sz300394)、沃尔核材(sz002130)等多股跌超9%;机器人(sz300024)概念展开回调,金奥博(sz002917)、中坚科技(sz002779)等多股跌停。个股跌多涨少,沪深京三市近3000股飘绿,上午半天成交7397亿。午间收盘沪指涨0.3%,深成指跌0.59%,创业板跌1.55%。2、板块概念方面,DeepSeek、AI智能体、银行、钢铁等板块领涨;铜高速连接、CPO、机器人(sz300024)、液冷服务器等板块领跌; 3、两市共2215只个股上涨,38只个股涨停;2765只个股下跌,33只个股跌停;19只股票炸板,炸板率38%。 -
数字江恩今天 03:35:03
今天开盘不久,本人就评价了,这是强势震荡略微向上倾斜,而不是强势拉升。下午维持这个判断,强势震荡、向上倾斜。也就是看下午脉冲一个+震荡,还是震荡到尾盘+脉冲一个。 -
波段擒龙今天 03:34:10
ETF午间收盘涨跌不一,华泰天天金ETF(511670)领涨9.21%,新经济ETF(159822)涨7.61%,广发货币ETF(511920)涨6.06%,沙特ETF(520830)领跌6.72%,德国ETF(513030)跌6.64%,法国CAC40ETF(513080)跌6.46%。 -
波段擒龙今天 03:33:56
A股三大指数涨跌不一,截至午盘,沪指涨0.30%,深成指跌0.59%,创业板指跌1.55%,北证50指数跌0.38%,沪深京三市成交额7401亿元,较上日缩量38亿元。两市近3000只个股下跌。板块题材上,铜缆高速连接、CPO、液冷服务器、机器人(sz300024)等板块跌幅居前,银行、AI语料板块涨幅居前。 -
史月波高控盘今天 03:31:23
喝酒是为了创作,即兴发挥一下,提前祝大家春节快乐【更多独家重磅股市观点请点击】