多达64核心,高效处理复杂AI工作

多达64核心,高效处理复杂AI工作
2024年09月06日 09:45 泡泡网

  2023年12月中旬,Intel宣布推出了其代号为“Emerald Rapids”的第五代Xeon系列处理器,专为数据中心和高性能计算环境设计。这款Emerald Rapids处理器基于Intel 7工艺制造,集成了Raptor Cove ISA架构的P-Core性能核心。它能够容纳多达64个核心、128个线程以及高达480MB的三级缓存。相较于上一代的Sapphire Rapids,Emerald Rapids在结构上采用了双tile布局,两个核心通过Modular Die Fabric技术连接至缓存阵列,并配备了4个内存控制器和对8通道DDR5-5600内存的支持。在两个处理器die之间,还整合了6个PCIe控制器、4个UPI通道和4个加速引擎。

  第五代英特尔至强可扩展处理器在每个内核都内置了AI加速功能,无需依赖独立的加速器即可处理复杂的AI工作负载,包括能够对参数多达200亿的模型进行推理和微调。得益于更高的内存带宽,DDR5比DDR4的带宽提升了高达66%,这不仅可以提升性能、容量和能效,还能降低成本。同时,全新的I/O速度能够最大化CPU与设备间的数据传输速率。第五代英特尔至强处理器拥有多达80个PCIe 5.0通道,非常适合快速网络、高带宽加速器和高性能存储设备。与第四代英特尔至强处理器相比,整体性能提升了21%,推理性能提升了42%,内存速度提升了16%,三级缓存提升了2.7倍,每瓦性能提高了10倍。

  在通用计算领域,第五代英特尔至强可扩展处理器表现卓越,为当前各种关键工作负载提供了坚实的支持。这些处理器利用英特尔高级矩阵扩展技术这一内置AI加速器,可以加速基于CPU的深度学习推理和训练。这在许多情况下消除了独立加速器带来的额外成本和技术复杂性。新一代英特尔至强处理器非常适用于参数少于200亿的大语言模型,通常能够满足客户服务级别协议的要求。英特尔AMX在迁移学习和模型调优方面也表现出色,能够在短短4分钟内完成模型训练,无需其他硬件支持。目前,65%的数据中心推理任务都在英特尔至强处理器上运行,客户因此能够充分利用现有的通用AI架构,而不必为转移到GPU基础设施的复杂性而烦恼。

  无论是处理本地、云端还是边缘的工作负载,内置英特尔加速引擎的英特尔至强处理器都能帮助您的业务达到新的高度。这些加速引擎具备一系列优势,包括更强的数据保护能力和更高效的基础设施利用。

  从英特尔第三代至强处理器助力腾讯打造云小微智能语音与视频服务接入平台,为腾讯云小微智能语音与视频服务注入强劲动力;到Gunpowder使用英特尔第四代至强处理器运行Google Cloud C3实例以加快渲染速度;再到京东云上线基于第五代英特尔至强可扩展处理器的新一代服务器,整体性能比上一代提升了23%。在大模型落地过程中,面对算力需求的指数级增长、高算力成本和异构复杂度等挑战,英特尔至强处理器通过不断的更新迭代,在模型推理性能上提供了卓越的表现和更高的适应性,成为用户构建AI算力系统的首选。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片