移动客户端

新浪科技> 数码 > 正文

美团发布 LongCat-Flash-Lite 轻量化 MoE 模型，智能体与代码表现突出

美团发布 LongCat-Flash-Lite 轻量化 MoE 模型，智能体与代码表现突出

2026年02月06日 16:04 IT之家

新浪财经APP 缩小字体放大字体收藏微博微信

IT之家 2 月 6 日消息，美团今日（2 月 6 日）发布 LongCat-Flash-Lite 模型，这是一款拥有 685 亿参数，每次推理仅激活 29 亿 ~45 亿参数的轻量化 MoE 模型。

通过将超过 300 亿参数用于嵌入层，LongCat-Flash-Lite 宣称不仅超越了参数量等效的 MoE 基线模型，还在与同规模现有模型的对比中展现出“卓越的竞争力”，尤其在智能体与代码领域表现突出，并依托 YARN 技术可支持最长 256 K 上下文，能高效处理长文档、大规模代码分析等场景。

同时，该模型基于嵌入扩展的应用与系统级优化，让模型推理效率大幅提升，在输入 4K，输出 1k 的典型负载下，LongCat API 可提供 500-700 token/s 的生成速度。

美团宣布向开发者开放 LongCat-Flash-Lite 版本 API 接口，可登录 LongCat API 开放平台申请，每日免费额度 5000 万 tokens。

新浪众测

新浪众测

新浪科技公众号

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

创事记

阅读排行榜

评论排行榜

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技

新浪数码

新浪手机

科学探索

苹果汇

新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

新浪首页新浪众测

语音播报返回顶部