谷歌公司4月17日宣布,在Google AI Studio和Vertex AI中以API形式推出Gemini 2.5 Flash预览版AI模型。这款混合推理模型具备动态计算能力,开发者可根据查询复杂度灵活调整处理时间。
用户可通过Gemini应用内的模型选择器直接使用该模型,并结合Canvas工具优化文档和代码编辑。谷歌表示,Gemini 2.5 Flash专为高容量、实时应用场景设计,特别适合客户服务和文档解析等需求,是响应式虚拟助手和实时总结工具的理想选择。
作为首款全混合推理模型,Gemini 2.5 Flash允许开发者按需开关推理功能,平衡响应质量、成本和延迟。与同类前沿模型相比,其成本优势明显,定价为每百万tokens输入0.15美元,输出0.6至3.5美元不等。

海量资讯、精准解读,尽在新浪财经APP
VIP课程推荐
加载中...
APP专享直播
热门推荐
收起
新浪财经公众号
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
