回归 Pascal:英伟达 RTX 50 显卡全部 CUDA 核心支持 FP32 / INT32 双功能

回归 Pascal:英伟达 RTX 50 显卡全部 CUDA 核心支持 FP32 / INT32 双功能
2025年02月01日 13:27 IT之家

IT之家 2 月 1 日消息,英伟达现已公布 Blackwell GPU 架构白皮书,披露了 GeForce RTX 50 系列显卡的大量技术细节,其中相当值得注意的一点是 Blackwell 架构的全部单精度 CUDA 核心同时支持 FP32 / INT32 数据,这点上回归了九年前的 Pascal 架构。

▲ Blackwell 架构 SM 设计▲ Blackwell 架构 SM 设计
▲ Pascal 架构 SM 设计▲ Pascal 架构 SM 设计

英伟达在 GeForce 10 "Pascal" 世代仍采用单精度 CUDA 单元兼顾 FP32 / INT32 的设计,而在 Volta 和 Turing 两代上换用了两组 1:1 比例的 CUDA 核心分别承担 INT32 和 FP32 的方案

▲ Volta(左)、Turing(右)两代架构 SM 设计▲ Volta(左)、Turing(右)两代架构 SM 设计

来到 Ampere 架构,英伟达则为每个 SM 流式处理器的四个处理块(IT之家注:Processing Block)之一提供了 1 组 16 个 FP32 / INT32 单元和 1 组 16 个纯 FP32 单元;而在 Ada GPU 上,这一设计得到延续。

▲ Ampere(左)、Ada(右)两代架构 SM 设计▲ Ampere(左)、Ada(右)两代架构 SM 设计

Blackwell 架构上的统一 CUDA 使得每 SM 可能的 INT32 整数运算能力较 Ada 翻倍。不过在任何给定的时钟周期内,Blackwell 统一内核只能以 FP32 或 INT32 模式中的一种运行。

英伟达提到,Ada 架构 SM 是为标准着色器设计和优化的,而 Blackwell SM 则是为神经着色器设计和优化的

英伟达设计Pascal
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

0条评论|0人参与网友评论
最热评论
--------

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片