曦望新一代推理 GPU 芯片启望 S3 发布:单位 Token 推理成本降低 90%

曦望新一代推理 GPU 芯片启望 S3 发布:单位 Token 推理成本降低 90%
2026年01月27日 19:24 IT之家

IT之家 1 月 27 日消息,据界面新闻报道,国产 GPU 厂商曦望(Sunrise)发布了新一代推理 GPU 芯片启望 S3。这是该公司在近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。

据IT之家了解,启望 S3 是一款面向大模型推理的定制化 GPGPU 芯片。据了解,该芯片在典型推理场景下的整体性价比较上一代产品提升超过 10 倍。算力与存储设计上,芯片支持 FP16 至 FP4 精度切换,采用 LPDDR6 显存方案,显存容量较上一代提升 4 倍。

在应用层面,启望 S3 在 DeepSeek V3/R1 满血版等主流大模型推理场景中,单位 Token 成本较上一代降低约 90%。

曦望还同步发布了面向大模型推理的寰望 SC3-256 超节点方案,可适配千亿、万亿级参数的多模态 MoE 推理场景。此外,曦望还联合商汤科技、第四范式等生态伙伴,共同发起“百万 Token 一分钱”推理成本计划。曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”。

曦望前身是商汤科技大芯片部门,不久前宣布在一年内完成了近 30 亿元战略融资。2025 年,曦望芯片交付量已突破万片。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片