【TechWeb】12月12日消息,Google发布 Gemini 2.0 系列模型中的第一个模型:Gemini 2.0 Flash 的体验版,是迄今为止Google最强大的模型。
据介绍,Gemini 2.0 Flash 是建立在 1.5 Flash 的基础之上,与 1.5 Flash 相比,Gemini 2.0 Flash 在同样快速的响应时间下性能进一步增强。Gemini 2.0 Flash 在关键基准测试中超越了 Gemini 1.5 Pro,其速度是 1.5 Pro 的两倍。
Gemini 2.0 Flash 除了能够支持图片、视频和音频等多模态输入外,还可以支持多模态输出,例如可以直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音(TTS)音频。Gemini 2.0 Flash还可以原生调用 Google Search、代码执行以及第三方用户定义的函数等工具。
从今天开始,Gemini 2.0 Flash 体验版模型将对所有 Gemini 用户开放。开发者可以可以通过 Google AI Studio 和 Vertex AI 中的 Gemini API 获取,该产品将于明年1月份全面上市,届时也将推出更多型号。
接下来,Google会将 Gemini 2.0 的高级推理能力融入 AI Overviews,以攻克更复杂的主题和多步骤问题,包括高等数学方程、多模态查询和编码。Google本周已经在小范围进行了测试,并计划于明年年初在更大范围推出。同时,Google还计划明年将 AI Overviews 功能面向更多国家开放,适配更多语言。明年初,Google还会将 Gemini 2.0 扩展到更多 Google 产品中。
Google和Alphabet CEO Sundar Pichai 表示:“如果说 Gemini 1.0 是整合和理解信息,那么 Gemini 2.0 能够让信息更加有用。”(宜月)
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)