谷歌首个通用推理模型登场：揭秘AI推理“黑匣子”，登顶Arena LLM排行榜|推理|谷歌|黑匣子_新浪科技

谷歌 AI Studio 平台昨日（12 月 19 日）发布实验性的“Gemini 2.0 Flash Thinking”模型，主打“清晰展现思考过程”，是谷歌第一个通用推理模型。

该模型不仅能够解答复杂问题，还能模仿人类逐步推理，展现其“思考”步骤，这一创新功能有望革新 AI 领域，和 OpenAI 的 o1 推理模型展开竞争。IT之家附上相关演示如下：

Google DeepMind 首席科学家 Jeff Dean 演示了该模型如何通过一系列“思考”步骤解决物理问题；而 Google 产品负责人 Logan Kilpatrick 展示了模型如何处理包含图像和文本信息的推理问题。

该模型基于 Gemini 2.0 Flash 的速度和性能构建，在 Chatbot Arena LLM 排行榜上，Gemini 2.0 Flash Thinking 模型在所有类别中均排名第一，较之前的 Gemini-2.0-Flash 模型有显著提升，尤其在“硬提示”和“视觉”两项分别提升了 14 分和 16 分。