阿里通义千问发布小尺寸模型Qwen3-4B：超越GPT4.1-Nano 手机也能跑_新浪科技

快科技8月7日消息，今日，阿里通义千问宣布发布更小尺寸新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。

目前新模型已在魔搭社区、HuggingFace正式开源。

据介绍，在非推理领域，Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。

在推理领域，Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B（thinking）。

官方表示，2507版本的Qwen3-4B模型对手机等端侧硬件部署尤为友好。

以下为模型核心亮点

Qwen3-4B-Instruct-2507

通用能力均大幅提升，超越商业闭源的小尺寸模型GPT-4.1-nano，与中等规模的Qwen3-30B-A3B（non-thinking）性能接近。

新模型覆盖更多语言的长尾知识，在主观和开放性任务中增强了人类偏好对齐，可提供更符合人们需求的答复。

上下文理解扩展至256K，小模型也能处理长文本。

Qwen3-4B-Thinking-2507

推理能力大幅增强，AIME25高达81.3分，Qwen3-4B-Thinking-2507的推理表现可媲美中等模型Qwen3-30B-Thinking。

特别是在聚焦数学能力的AIME25测评中，以4B参数量斩获81.3分成绩。

Agent分数爆表，相关评测均超越更大尺寸的Qwen3-30B-Thinking模型。

256K tokens上下文的理解能力，支持更复杂的文档分析、长篇内容生成、跨段落推理等场景。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：拾柒

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

创事记

阅读排行榜

评论排行榜

科学探索

科学大家

苹果汇

众测

专题

官方微博

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

阿里通义千问发布小尺寸模型Qwen3-4B：超越GPT4.1-Nano 手机也能跑

创事记

阅读排行榜

评论排行榜

科学探索

科学大家

苹果汇

众测

来电聊

专题

官方微博

公众号