DeepSeek 再放降本大招：NSA 官宣发布，加速推理降低成本，并且不牺牲性能|推理|NSA|it之家_新浪科技

IT之家 2 月 18 日消息，DeepSeek 今日官宣推出 NSA（Native Sparse Attention），这是一种硬件对齐且原生可训练的稀疏注意力机制，用于超快速长上下文训练与推理。

NSA 的核心组件包括：

DeepSeek 官方表示，该机制可优化现代硬件设计，加速推理同时降低预训练成本，并且不牺牲性能。在通用基准、长上下文任务和基于指令的推理上，其表现与全注意力模型相当或更加优秀。

IT之家附论文链接：

https://arxiv.org/abs/2502.11089

关键词 : 推理 NSA it之家注意力

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

DeepSeek 再放降本大招：NSA 官宣发布，加速推理降低成本，并且不牺牲性能