大约一年前,当AMD推出其用于AI和高性能计算(HPC)的Instinct MI300X加速器时,亚马逊云服务(AWS)曾表达过将其部署到云端的兴趣。然而,亚马逊表示,由于缺乏强劲的市场需求,目前仍未部署这一加速器。
“我们以客户需求为导向,”亚马逊旗下公司Annapurna Labs的产品与客户工程总监Gadi Hutt告诉《Business Insider》。“如果客户明确表示有强烈需求,那么我们没有理由不部署。”
然而,至少根据Hutt的说法,目前还没有足够的需求来证明在AWS中部署AMD的Instinct MI300X加速器的合理性。虽然AMD的Instinct MI300X比英伟达的H100价格更低,但其软件生态尚不如英伟达的CUDA成熟,这让许多开发者望而却步。不过,随着AMD的硬件产品(例如Instinct MI325X)的持续改进,其软件也应会随之提升。
某种程度上,Hutt可能算是一个相关利益方,因为Annapurna开发的Trainium芯片在AWS数据中心中与AMD和英伟达的产品形成竞争。然而,如果他是在正式场合发表了上述言论,这就可以被视为AWS的立场。
谈到Trainium,通过自家设计的Trainium和Trainium2芯片,AWS不需要向AMD或英伟达支付溢价,这使得其基于Trainium的Trn1和Trn2实例相比英伟达H100 GPU驱动的实例价格更具竞争力。这可能也是非英伟达第三方解决方案需求较低的另一个原因。
谈到英伟达,AWS在其re:Invent大会上宣布将通过采用英伟达即将推出的Blackwell GPU加强其AI能力。在re:Invent大会上,AWS推出了搭载Blackwell GPU的P6服务器,反映出这些机器将备受市场期待。
尽管AWS尚未在云中提供AMD的Instinct MI300X,但它继续与AMD保持密切合作,并在云中提供了大量基于AMD EPYC处理器的实例。得益于其核心数量和内存子系统,这些处理器在计算和内存密集型实例中相较于英特尔至强处理器具有显著优势。
参考链接
https://www.tomshardware.com/tech-industry/weak-demand-prevents-amazon-from-deploying-amds-instinct-ai-accelerators-in-the-cloud-the-company-plans-to-strengthen-its-portfolio-with-nvidia-blackwell-gpus
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)