如果您希望可以时常见面,欢迎标星收藏哦~
来源:内容来自nextplatform,谢谢。
Brad McCredie(Brad McCredie)喜欢引擎,更重要的是,他喜欢让引擎变得更快。他对道奇挑战者(Dodge Challenger)的热爱——他拥有多辆,包括一辆Hellcat——体现了他对速度的渴望。这种热情同样体现在他引领IBM Power处理器设计几十年的工作中,以及在过去几年中,作为AMD GPU平台的企业副总裁,帮助AMD发布了过去两代Instinct GPU的设计。
根据我们了解,AMD在GPU销售方面刚刚度过了一个爆发式增长的年份,这在很大程度上归功于其“Aldebaran”MI200系列以及最近的“Antares”MI300系列的广泛采用。预计2024年AMD将向数据中心销售超过50亿美元的GPU加速器,几乎是2023年GPU销售收入的10倍。尽管AMD尚未发布2026年数据中心GPU销售的预测,但我们预计在2024年第四季度财报发布时会公布这一数据。考虑到加速器需求的旺盛以及供应的稀缺,今年的收入翻倍甚至三倍增长也不令人惊讶。
最近,我们与麦克里迪进行了座谈,讨论了加速器引擎以及未来AMD GPU的可能发展。
提摩西·普里克特·摩根(Timothy Prickett Morgan):在2024年11月的最新Top500超级计算机排名中,如果仅看新增的机器,我现在正用这种方式分析Top500,搭载AMD GPU和AMD CPU的系统在理论峰值FP64性能中占据了72%。使用各种CPU和Nvidia GPU的系统占27.2%。这是AMD首次在这一排名中超越Nvidia,主要归功于劳伦斯·利弗莫尔国家实验室的“埃尔卡皮坦(El Capitan)”超级计算机及其更小的兄弟系统。
在2024年6月的排名中,新增的FP64精度计算能力中,使用Nvidia“Grace”CPU和“Hopper”GPU的系统占比略高于54%,而其他各种CPU与Nvidia GPU的系统占25.6%。
这是否意味着Nvidia和AMD之间的竞争反映了高性能计算(HPC)市场可能会在某个时刻趋向均衡,最终各占一半?
Brad McCredie:我认为HPC的容量确实需要投资。你必须设计双精度和双精度数据传输,要做一些工作来支持HPC生态系统。你可以给HPC生态系统提供其他东西,让他们自己处理,我认为过去其他厂商曾经有过这种做法。我们选择为HPC客户设计。如果你看我们的路线图,我们的双精度计算非常强大,能够支撑到未来。
顺便说一句,我们的芯片颗粒架构使我们更容易做出这个决定。我们不是在构建大型的单体芯片,这让我们有了更多的灵活性来调整设计,未来会有一些非常有趣的事情发生。HPC在全球中非常重要,机器必须像瑞士军刀一样,既要支持AI,又要支持HPC,并且两者都要做得很好。凭借芯片颗粒架构,我们能够设计出在这两种计算需求之间具有不同比率的机器。
TPM:你们会为此重新架构吗?因为目前的GPU设计并未做到这一点。它们在芯片颗粒中专门有用于向量和矩阵计算的功能,然后通过增加更多芯片颗粒来扩展。这些功能可以分开为不同的芯片颗粒,然后单独调节它们的容量……
Brad McCredie:我们正在调整架构的一些部分,以便能够实现这种灵活性。
TPM:有意思。就我目前的观察来看,AMD正在设计一款非常适合HPC的设备——64位精度和32位浮动点,并且可以很好地支持AI计算。相比之下,Nvidia正在设计一款AI处理器,它对于HPC也足够好。
例如,“Blackwell”B200s在其张量核心上提供45 teraflops的FP64计算性能——而我们甚至不知道CUDA核心在FP64上的具体表现如何,或者GB200芯片上有多少个CUDA核心。而单个“Hopper”H100的CUDA向量核心在FP64上的计算能力为33.5 teraflops,张量核心则为67 teraflops。Nvidia的FP8和FP4的计算能力在AI工作负载中有显著提升,但在Blackwell插槽中,相比Hopper插槽,FP64的计算能力大幅减少。
Brad McCredie:我们的观点是,如果你有正确的芯片颗粒策略,你不需要在这两个方向上做出选择。我认为能够避免做出这种选择,才是关键。
TPM:嗯,Instinct MI300X在向量核心上提供81.7 teraflops的FP64计算能力,在张量核心上提供163.4 teraflops,这对于传统的HPC工作负载来说是一个巨大的优势。
我不认为Nvidia对于HPC社区感到担忧,因为Hopper依然在供应——就像当年Nvidia推出的首款为AI工作负载设计的加速器——“Maxwell”GPU出来时,“Kepler”K80依然可用一样。
Brad McCredie:我认为,你必须为HPC社区提供他们所需的硬件,以便完成他们的计算工作。所以你需要考虑AI与HPC之间的数据格式,它们在这一点上有所不同。两者的系统结构也在发生变化。我认为,在这方面的灵活性同样非常重要。
虽然在IBM和AMD的工作经历之间,麦克里迪与妻子曾在美国各地旅行,这一创造性的混合架构也随之诞生。在这个类比中,很明显,哪一辆车代表了GPU。
TPM:你能增加更多来自GPU的Infinity Fabric带宽吗?因为在我看来,这是我希望能看到更多的地方。根据基准测试,从加速器出来的带宽似乎在AI训练中比在AI推理中更为重要。在你们的测试中,NVLink和NVSwitch在某些AI推理工作负载上的帮助似乎不如Infinity Fabric。
我可以设想,在芯片颗粒上调节其中一个参数,将更多的Infinity Fabric分配给训练GPU,而不是推理GPU,同时保持其他部分基本不变,这样你就可以交叉连接更多设备,扩大内存域和设备之间的高带宽连接。或者说,这种改变是不是太大了?
Brad McCredie:AI显然是一个庞大的市场,AI领域的变化层出不穷,越来越多的论文在讨论这个问题。你可以将推理任务拆解为填充和解码——它们有不同的计算需求。普遍的看法是,解码任务更需要内存带宽,而填充任务更依赖计算能力。每一种任务都有其独特的内存带宽和计算需求……
TPM:所以,你可以在单个设备上或者跨不同设备在系统板上制定一个工作流程。将数据从一端输入,机器需要加速时就处理,在适当时将数据传递给其他设备。
Brad McCredie:嗯,确实有很多有趣的事情正在发生,我只能这么说。我认为这些都会对未来的架构产生影响。
TPM:我也认为,是时候打破记忆体必须靠近GPU的束缚了,使用电缆连接。我希望更多的内存能够通过光纤链接与GPU相连接,而不必依赖堆叠内存,将其保持在几毫米内的距离,这样可以避免堆叠带来的高昂成本。你怎么看?
Brad McCredie:这确实是一个挑战。如果你考虑我们在GPU中塞入了多少内容,我们已经突破了基本硅片的限制。所以所有这些设备都变得更大,散热也变得至关重要。
TPM:所以,这也是我说的,想要让内存与计算设备之间的距离更远一些,避免由于靠得太近而引起的二次加热效应,影响内存的稳定性。
Brad McCredie:你描述的情况就像是一团乱麻,这不是第一次有人提这个问题。
这并不是侮辱,我知道你明白。但如果你回顾过去推动计算发展的因素,我觉得我们可以就“是晶体管的加速带来了性能提升,还是集成度的提升更重要”展开一场很好的讨论。对于CPU,缓存曾经是独立的,后来北桥和南桥集成到芯片上。我们可以讨论,到底是把这些组件集成到同一个芯片上带来了更多的性能,还是晶体管的运行速度提升更为重要?
我认为不看好集成化,并且选择将各部分分开发展,是一个很难打赌的选择。我认为我们会继续推动更多的堆叠技术。我认为我们会向上而非向外发展,但不要误会我的意思,虽然我没有把这些写在石板上,但更快、更低功耗的互联仍然会有它的地位。问题是:我们将如何划定这些界限,在哪里设定接口?
TPM:这个决定将由资金推动……
Brad McCredie:这个决定将由性能来驱动,按照我的看法,性能最终也会影响到资金。
TPM:好吧,最后问一个与技术无关的问题。你在IBM引导Power CPU设计已经很长时间了,也在AMD引导了几代GPU设计,你现在还觉得有趣吗?
Brad McCredie:是的,我觉得很有趣。显然,构建CPU是非常酷的,但之前有太多的代码和遗留问题,限制了我们的进展。但AI工作负载真是不可思议,网络带宽、延迟、计算能力和内存容量与性能——你投入设计的每一项内容都会被充分利用。我从未见过这样的工作负载。
TPM:做这些计算引擎越来越难了吗?
Brad McCredie:看看我们行业中的各种微观生态。显然,技术的扩展——摩尔定律等等——这变得越来越难了吗?是的,制程工程师必须做出FinFET 3D晶体管。但这个行业真是太惊人了。当然,我们需要找到新的方法,即使在更高层次上也是如此。比如说,我们引入了更多的网络技术,因为我们第一次在进行并行处理。我们终于找到了真正的并行工作负载。
我们正在推行3D封装技术,把更多的硅片面积压缩进一个空间,然后再进行散热。我不确定“更难”是不是最合适的词,但我们确实在以不同的方式做这件事。不过,有一件事是肯定的,正如我大学教授常说的:“布拉德,始终要紧跟性能的步伐,因为每个人都希望变得更快。”所以,每天我们都在寻找更快的方式。
https://www.nextplatform.com/2025/01/24/brad-mccredie-is-the-pedal-to-amds-datacenter-gpu-metal/
专注半导体领域更多原创内容
关注全球半导体产业动向与趋势
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4017期内容,欢迎关注。
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦


APP专享直播
热门推荐
深夜飙车近300公里/小时!李某某,被抓 收起深夜飙车近300公里/小时!李某某,被抓
- 2025年03月08日
- 23:42
- APP专享
- 扒圈小记
1,858
美方“威胁”伊朗:不谈判可能面临军事行动
- 2025年03月09日
- 03:38
- APP专享
- 扒圈小记
1,316
人大代表谈提振消费:要让老百姓有钱花、敢花钱、愿意花、有地方花钱
- 2025年03月08日
- 09:07
- APP专享
- 北京时间
1,272

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 10:13:27
【易明医药(sz002826):董事、股东拟合计减持不超2.04%公司股份】易明医药(sz002826)(002826.SZ)公告称,公司董事、持股5%以上股东周战计划15个交易日后的3个月内,以集中竞价方式或大宗交易方式减持公司股份不超过359万股(不超过公司总股本的1.8828%);董事许可计划15个交易日后的3个月内,以集中竞价方式或大宗交易方式减持公司股份不超过30万股(不超过公司总股本的0.1573%)。 -
趋势领涨今天 08:44:37
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 08:44:26
住房和城乡建设部部长倪虹在十四届全国人大三次会议民生主题记者会上表示,近期正在组织编制“好房子”建设指南,也在修订住宅项目规范,其中一项就是要把住宅层高提高到不低于3米。 -
趋势领涨今天 07:55:55
百亿私募基金经理、民间股神林园最新发声:现在是入场的好时机,不用太久,市场会给大家一个很大的惊喜。林园说,现在不是讲风险的时候,而是比胆量的时候。也许我可能还会说错。但最终我相信,我会说对一次。这一次就足够我们吃一辈子了,机会很大!不过,林园的观点一般是反向指标。2023年,林园天天吹医药,结果,医药板块再也没有高点;2024年6-8月份,林园发表遍地是黄金的观点,结果,去年6-8月份是大家最难受的时候! -
趋势领涨今天 06:12:18
根据国家粮食和物资储备局发布的最新数据显示,截至目前,全国秋粮累计收购量超3亿吨,相当于2024年秋粮产量的60%。秋粮主要包括水稻、玉米、大豆,占全年粮食产量七成以上,主要分布在东北、黄淮海、长江中下游、西南地区等13个粮食主产区。 -
趋势领涨今天 05:58:00
2025年2月份,全国居民消费价格同比下降0.7%,其中城市和农村均下降0.7%,食品价格下降3.3%;1—2月平均,全国居民消费价格比上年同期下降0.1%;2025年2月份,全国工业生产者出厂价格同比下降2.2%,环比下降0.1%。整个数据是低于预期,2月CPI-0.7%,PPI-2.2%,其中CPI预期是-0.5%,PPI,环比下降0.1%,扣除一月份春节影响,实际2月份CPI同比上涨0.1%,统计局说了,一些领域价格显现积极变化,当前物价温和回升的态势没有改变。 -
趋势领涨今天 04:11:02
【2月份全国居民消费价格同比下降0.7%】国家统计局发布数据,2025年2月份,全国居民消费价格同比下降0.7%。2月份,食品烟酒类价格同比下降1.9%,影响CPI(居民消费价格指数)下降约0.54个百分点。 -
趋势领涨今天 01:00:35
=加入潜伏擒牛VIP,享四大顶级服务=【1】购买VIP自动加入私密小直播间!【2】每周3-5只超短金股调入调出服务,适合实时看盘的投资者!【3】每周一份高端内部绝密文章:包含近期布局、热点版块、指数预判!【4】每月2~3只高端中线金股服务!(VIP超短、中线个股均有涉足,让上班族也能跟上VIP节奏!)现月课7.5折,1288元!季课6.9折,3558元,续费季度更划算!新朋友可先月课体验!点网址,直接买,订购地址:【更多独家重磅股市观点请点击】【更多独家重磅股市观点请点击】 -
趋势领涨今天 01:00:15
下周有5只新股申购,周一一只,周二两只,周五两只。以前每周最多不超过3只新股申购,下周一下子提到了5只,你们说这是新股发行加速吗?有人说,现在行情走好,新股发行多一点是正常的,重点是这些新股有多少不是垃圾?像杭州六小龙如果在A股上市,我们会热烈欢迎,但如果上市是为了卖公司,大家还是会用脚投票的!二、存储行业启动新一轮涨价周期全球知名的存储产品供应商闪迪(SanDisk)发予客户的涨价函披露。据称,闪迪将于今年4月1日开始实施涨价,涨幅将超10%,存储芯片涨价,主要是因为涨价AI相关行业风生水起,AI与新兴技术驱动需求大幅增加,引发了存储行业涨价,该消息主要利好存储芯片相关板块,但这个板块已经炒作很多次了,大家不要希望太高。上周五上涨的有色金属就是涨价消息的刺激,另外还有因为周末加的事情,下周相关农产品(sz000061)等应该也有涨价的预期,对这些板块也是利好。总的来说,下周市场应该会迎来震荡,上半周虽然还有向上的可能,但下半周还是要注意风险 -
趋势领涨今天 01:00:11
大盘自2月份底收出中阴线以后,上周走出了修复性行情,三大股指都收回了前期跌幅,沪市还创出了新高,创业板和深市只是收复了前面的中阴线,主要原因就是沪市有中字头、有银行板块,关键时候能够出现护盘,但创业板应该才是大家账户的真实写照,也就是大盘虽然没有下跌,但想赚钱,不是那么容易!大盘看似走势很强,但上周四内资流入近400亿元,周五却大幅流出777亿元,这是赶着去过三八吗?现在大家都看不到外资的流向,但内资的流出极大地打击了大家做多的信心,内资只要出现大幅流出,大盘想上涨是很难的!上周四大盘跳空向上,留下了一个跳空缺口,但创业板已经回补了这个缺口,不出意外的话,沪市和深市也会回补这个缺口,所以,大家整体还需谨慎。板块上,因为有重要事件,中字头、银行板块在护盘,大家都在炒作题材股,这就是蓝筹股搭台,题材股唱戏,但一旦蓝筹股不搭台,题材股还会唱戏吗?这个概率是很大的,主要原因一是下周重要事件要结束;二是一季报预告即将开始,一般业绩不好的上市公司要率先发布预告,这些个股基本都是集中在高位题材股。另外,牛市旗手券商走势很弱,很多人都说现在就是牛市,如果是牛市,那券商为什么不启动呢?上周大盘量能已经放大到接近2万亿,严格说已经到了券商启动的节点,但券商还是涨一天,跌两天,严重影响了市场人气,市场热点还是机器人(sz300024)和人工智能相关概念上,但这些已经经过了连续大涨的个股,有几个人敢追呢?所以,大家不要看见每天有近两千只个股上涨,但你真正参与进去,想赚钱还是很难的,因为第一天上涨的板块,第二天不一定有逃跑的机会,主要原因就是量化在不停地收割,量化现在还有所忌惮,重要事件结束以后,你们觉得他们还会忌惮吗?本周末消息面比较平静,我们昨天的文章已经做了详细解读,大家注意查看前文,这里分享两个行业方面的消息: