Gemini 3中文测评结果发布：首超GPT-5 全球第二|推理_新浪科技

快科技11月19日消息，2025年末全球AI竞技场再掀波澜，测评机构SuperCLUE最新报告显示：谷歌Gemini-3-Pro-Preview在SuperCLUE 9月中文大模型基准测评中获得了70.80的总分。

它超越 GPT-5(high) 1.43 分，较GPT-5.1(high)落后1.71分，位居全球第二。Gemini-2.5-Pro目前排名全球第七。

Gemini-3-Pro-Preview的推理效率相较于Gemini-2.5-Pro有些许提升，从平均每题花费32.2秒降低到31.9秒。推理成本从24.5元/百万Tokens上升到32.0元/百万Tokens。

据了解，本次测评覆盖六大核心维度，数学推理、科学推理、代码生成（含web开发）、智能体Agent（多轮工具调用）、幻觉控制、精确指令遵循。

与GPT-5.1(high)相比，Gemini-3-Pro-Preview的优势集中体现在幻觉控制，科学推理旗鼓相当，而在其他四个方面全面落败。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：随心

关键词 : 推理

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

Gemini 3中文测评结果发布：首超GPT-5 全球第二