
作者 | Yoky
邮箱 | yokyliu@pingwest.com
3月6日,中国大模型领域同时发生了两个上热搜的AI话题:
一边是AI Agent产品Manus,另一边则是阿里巴巴全新开源(16.730, -0.60, -3.46%)的通义千问QwQ-32B模型。
前者引发的讨论中,不少人把它称为DeepSeek级别的“炸裂”成果,并称“硅谷因它一夜无眠”。不过有趣的是,在国际AI社区中,真正引起广泛讨论的其实是后者。
凌晨正式发布模型后,QwQ-32B当天即登顶HuggingFace的开源模型榜单。

这款模型以32B的相对精简参数规模,却实现了与目前最强开源模型DeepSeek-R1相匹敌的性能,击败了老对手OpenAI o1 mini。
这对于开源社区的开发者吸引力巨大。HuggingFace联合创始人Vaibhav Srivastav几乎成了Qwen系列的忠实粉丝,每次发布都不缺席,成了点赞专业户。

甚至有人开始玩起了新梗,当遇上OpenAI和QwQ 32B的分岔路口,向左还是向右?

“性能惊人,尺寸小能量大,运行快。”Reddit的讨论开始还真有点“炸裂体”的味。

还有开发者开始像分享对一款现象级消费产品的评测一样,分享调用它的最佳设置。

以及,那个每次必不可少的,一直以来的疑问:

所以到底怎么发音?
1
32B参数,以小搏大,重构游戏规则
根据官方报告,在一系列权威基准测试中,千问QwQ-32B 模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1:
在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型;在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。

这些只是最基础的能力展示。而更多的热议来自开发者自己的需求和体验。
最让开发者感到兴奋的是,当参数变小但性能不变时,一台消费级显卡的硬件上,就能完成部署!

苹果的ML工程师Awni Hannun也第一时间体验了模型,他发文展示了QwQ-32B在配备MLX(专门为苹果芯片设计的开源框架)的M4 Max芯片电脑上的运行速度很快,并公开了它的一些思考片段。

多位开发者实测证实,QwQ-32B可在MacBook M系列芯片设备上流畅运行,其量化版本(q4_K_M)甚至在仅有16GB内存的设备上实现了每秒40 token的推理速度。这一表现远超同规模模型的部署要求,大幅降低了硬件门槛。

经过开发者测算,QwQ-32B对比DeepSeek-R1的671B参数,显存需求从1500GB降至24GB VRAM,“小参数+强优化”路径,验证了中等规模模型突破性能瓶颈的可能性。
在性能方面,QwQ 32B延续了强化学习提高模型性能的路径,在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升,在一系列权威基准测试中,几乎超越了o1 mini,比肩DeepSeek R1,尤其在数学和代码能力方面,远胜于同尺寸的推理模型。

Reddit用户为了进一步验证QwQ的推理能力,为QwQ32B设置了一道物理原理推导任务,能够完整演示从牛顿定律到最小作用量原理的数学推导过程,该用户调侃的说2026应该不会为ChatGPT Pro付费了。

Anthropic的投资机构Menlo Venture的投资人,也第一时间密切关注,对比了QwQ-32B和DeepSeek R1的推理成本,发现前者仅为后者的1/10的token成本,但效果能够达到DeepSeek-R1与o3-mini之间的性能水平。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。
此前企业部署顶级AI模型通常需要投入大量资金购置高端GPU集群,并面临复杂的分布式部署挑战和持续的电力成本压力,这意味着,企业不再需要构建复杂的GPU集群和高带宽网络来支持模型运行,能够在更低的算力环境下部署推理模型,避免大参数模型所需要的并行通信开销,同时单机部署也能够大幅降低运维门槛,使得中小企业也能负担得起高性能AI模型的落地应用。
同时,用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。
1
Qwen成了硅谷最爱的开源基座
除了QwQ-32B模型本身,一个围绕着Qwen的开源生态,也在渐渐成型。
在发布模型的过程中,Qwen的负责人林俊旸不停转发各种主流开源工具对QwQ的快速适配,除了发布模型本身,他似乎更着力于邀请大家通过不同的工具对QwQ-32B进行体验和二次开发。

另一位Qwen的核心团队成员Hui binyuan特意提到,欢迎大家在Qwen的基础上开发更有意思的东西。

在一众快速适配QwQ的厂商中,一个有意思的案例来源于Groq。
它在QwQ-32B发布的第一时间即完成GroqCloud部署,实现400 token/s推理速度。得益于Groq LPU架构的确定性执行特性,与QwQ-32B的密集模型设计形成互补,并以每百万输入代币 0.29 美元,每百万输出代币 0.39 美元的超低价格提供服务。


这家硅谷明星的AI Infra公司,号称要做到“最快的推理平台”,目前已经吸引了百万开发者,平台已经渐渐与开源模型包括LLma、DeepSeek、Qwen模型系列深度绑定。
而且,它是一个拥有自己芯片产品的公司。Groq 创始人是谷歌专用芯片NPU 发明者之一Jonathan Ross。它创办的Groq,设计了与GPU不同的LPU (语言处理单元),专为AI推理所设计的新型端到端处理单元系统,借助这种自己掌握的软硬件结合优势,它提供的模型的部署服务总是最快的之一。
因此它的很多动作基本成为了开源的重要风向标之一,哪个模型上了Groq,意味着开发者对它的需求够高,而它提供的极速的体验,又会帮助这些模型让更多人了解其性能。这是一个开源和语言模型上下游生态的典型正向循环机制。
在不到两年的时间里,Qwen正在成为向往开放开源的模型世界的开发者的首选之一。目前,海内外开源社区中Qwen的衍生模型数量已突破10万,超越Llama系列衍生模型,通义千问Qwen稳居世界最大的生成式语言模型族群。根据Huggingface2025年2月10日最新的全球开源大模型榜单,排名前十的开源大模型全部是基于通义千问Qwen开源模型二次开发的衍生模型。
同时,越来越多的学术界知名研究机构和学者,基于Qwen系列模型展开研究。李飞飞等斯坦福大学和华盛顿大学研究人员基于阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,仅使用16块H100 GPU,通过26分钟的监督微调,便打造出了性能卓越比肩OpenAI的o1和DeepSeek的R1等尖端推理模型的s1-32B模型。
近期,伯克利的计算实验室在QwQ-preview的基础上,花费了450美元创建了数据集,训练出了o1级的自有推理模型。

据统计,从2023年至今,阿里通义团队已开源200多款模型,包含大语言模型千问Qwen及视觉生成模型万相Wan等两大基模系列,开源囊括文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等「全模态」,覆盖从0.5B到110B等参数「全尺寸」,并在多个榜单中斩获冠军。
最近阿里巴巴连续开源了多个模型,每一个都会在海外社区引发广泛关注,有开发者感慨并剧透到,QwQ-32B是其中一个,而它可能还不是Qwen系列此轮会发布的最强的那个。
通义的大招也许还在后面。

点个“爱心”,再走 吧


APP专享直播
热门推荐
余承东回应华为Pura X价格争议:用了新技术,成本非常高 收起余承东回应华为Pura X价格争议:用了新技术,成本非常高
- 2025年03月21日
- 10:36
- APP专享
- 扒圈小记
43,748
取代“中国制造”?印度大计划被爆“夭折”
- 2025年03月22日
- 01:50
- APP专享
- 扒圈小记
33,331
余承东回应被骂:说话不是很严谨,情商也比较低
- 2025年03月22日
- 01:38
- APP专享
- 北京时间
2,084

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 03:20:22
高盛:3月至今全球对冲基金卖出中国股票 但整体净配置仍然增长根据高盛Prime Services数据,对冲基金在2025年3月逆转了年初至今在中国市场的17%的购买行为。这意味着这些基金在过去一段时间内对中国市场的投资策略发生了明显转变,从积极买入转向了部分卖出。从净配置来看,中国股票在月度(MTD)期间仅出现了轻微的净卖出,但净配置比例却增加了1%,达到9.1%,处于五年来的56%分位。这表明尽管对冲基金有所卖出,但整体市场对中国资产的配置仍在增加。这里我们要说的是,对冲基金本来就是分流风险的,3月份美股大跌,买入中国资产对冲;现在美股反弹,卖出中国资金补仓美股,这些都是正常的,但打铁还需自身硬,不要老想着外资来给你撑腰,重点是内资不能天天砸盘!外资能有多少钱?内资才是主心骨! -
趋势领涨今天 01:43:53
在公布年报季报的时候,玉龙股份(sh601028)主动退市,这是怕查吗?不过,值得点赞的是玉龙股份(sh601028)给出了现金选择权,行权价格为13.20元/股,高于停牌前收盘价13.04元/股。这就是一家良心公司!比那个东方要强百倍!希望有问题的公司都来向他学习,毕竟散户才是弱势群体。所以,我们建议证监会出一条规则,只要做了假账,有问题的公司,主动退市,行使现金选择权,以后都不再追究责任,否则,一旦查出问题,就让他倾家荡产,牢底坐穿,你们说呢?昨天港股大跌,晚间中概股出现下跌,这是非常正常的,但富时A50是上涨的,美股也出现了反弹,下周大盘应该有一个回抽,但月底还是要注意风险,特别是高位题材股的风险。 -
趋势领涨今天 01:43:46
关键时候,个人消费贷落地,自主支付的金额上限可阶段性从30万元提高至50万元,最长7年。消费贷主要利好银行、大消费板块,间接利好股市,因为很多人可以通过消费贷的名义贷款进入到股市!以前行情走好时,有过严查消费贷进入股市的情况,现在要维护市场,显然还远远没有到严查的时候。三、个股利空继续堆积1、联创股份(sz300343):自3月25日被实施其他风险警示 股票简称变更为“ST联创”;2、凯大催化(bj830974):因涉嫌信披违法违规被证监会立案;3、中电港(sz001287):国家集成电路基金、国风投基金拟合计减持公司不超6%股份;4、证监会对*ST普利(sz300630)重大财务造假案依法从严行政处罚 深交所将对其启动股票终止上市程序;5、立航科技(sh603261):公司实控人、董事长刘随阳被立案调查和实施留置等。上周钦点的东方集团退市,股票连续跌停,到现在还没有打开跌停;本周又钦点了*ST普利(sz300630)退市,下周应该也是连续跌停了,对有问题还没有处罚,特别是ST个股,大家一定要注意风险,一旦踩上,血本无归!四、玉龙股份(sh601028)成今年首家拟主动退市的A股上市公司玉龙股份(sh601028)公告,公司经营状况不佳,现金流持续恶化,公司经营面临重大不确定性,公司拟以股东大会决议方式主动撤回A股股票在上交所的上市交易,并申请股票进入全国中小企业股份转让系统退市板块继续交易。 -
趋势领涨今天 01:43:42
昨天应该是年后最悲惨的一天,大盘出现了放量大跌,两市不足千只个股红盘,近50只个股跌停,内资大幅流出超过800亿元,这是赶着去干嘛呢?以前美股打个喷嚏,A股就感冒,现在怎么变成了港股咳嗽一声,A股就吓尿了呢?如果硬是要给A股下跌找个理由,那就是期指交割,每月收割两次,比美股每三个月收割一次多了很多,大家都提了很多次,难道关键人物会不知道吗?如果量化制造了大国神器,那这个期指交割又是中饱了谁的私囊呢?一、央妈释放利好:1、根据国内外经济金融形势和金融市场运行情况 择机降准降息;2、研究创设新的结构性货币政策工具,重点支持科技创新领域的投融资、促进消费和稳定外贸;3、用好证券、基金、保险公司互换便利和股票回购增持再贷款 维护资本市场稳定。现在基本上是每个周末都要出现这三条,大家的耳朵都起茧了!择机降息降准,这个择机是什么时候?再不降息降准,大家都扛不住了!所以,大家看看就行了,话说三遍淡如水!二、消费贷新政落地:个人消费贷款自主支付的金额上限可阶段性从30万元提高至50万元对于信用良好、有大额消费需求的客户,个人消费贷款自主支付的金额上限可阶段性从30万元提高至50万元,个人互联网消费贷款金额上限可阶段性从20万元提高至30万元。在期限方面,针对有长期消费需求的客户,商业银行用于个人消费的贷款期限可阶段性由不超过5年延长至不超过7年。 -
趋势领涨今天 01:43:38
大家早上好!趋势为王,做股海的领航者,新的一天,新的战斗,欢迎你来到本直播室!新进的朋友请注意点赞,收藏本直播室,以方便你下次观看,谢谢大家的支持!【更多独家重磅股市观点请点击】 -
趋势领涨2025-03-21 10:30:06
亚星锚链(sh601890)(601890.SH)发布股票交易异常波动公告,经自查,公司目前生产经营活动正常,市场环境、行业政策未发生重大调整,生产成本和销售等情况未出现大幅波动,内部生产经营秩序正常。除已披露信息外,公司、公司控股股东及实际控制人不存在其他应披露而未披露的重大事项。 -
数字江恩2025-03-21 09:17:32
下周一,只要没有加速下跌,那么3350+-5个点区间,便是2-a的结束。其后,2-b反弹和2-c再次下跌便是下周的走势了,其中,2-c的时间会跨越下周到下下周,这就等下周再说了。总之下周都处于第二浪回踩之中,之上期间有一个短线2-b反弹。 -
数字江恩2025-03-21 09:17:24
5分钟图来看,3297的上涨第一浪已经结束了,内部结构看为abc结果。本周五直接跌破3376,已经确立了第二浪回踩已经开始,而第二浪内部也是abc的内部结构。【更多独家重磅股市观点请点击】 -
数字江恩2025-03-21 09:17:12
首先看30分钟图,本人上周末给出3430+-10点区间受阻震荡,本周完全实现,实际最高点3439点。这张图主要是看一下震荡结构的底线,其中A低点3297不容许跌破,这是3140向上走势,在震荡后继续上行的底线条件。只要不跌破A点,那么震荡后,图上的红色轮谷线、蓝色轮峰线都会突破,当然,是下周以后了。【更多独家重磅股市观点请点击】 -
数字江恩2025-03-21 09:16:56
大盘本周成交量略微缩量,冲高新高之后出现明显回踩,收盘再5周均线附近。目前5周线3371, 10周线3325,其中10周线继续上行,是下周的重要支撑线。板块上来说,本周没有持续性热点,各个板块走马灯一遍。