华为挺进万亿AI计算产业_新浪财经

　　华为挺进万亿AI计算产业

　　李正豪

　　基于自研AI芯片，华为不断扩大自己在AI计算领域的竞争优势。

　　9月18日，在2019年全连接大会上，基于前不久推出的昇腾910 AI处理器，华为推出了AI训练卡Atlas 300、训练AI服务器的Atlas 800，以及由上千颗昇腾910 AI处理器组成的Atlas 900 AI训练集群。尤其是Atlas 900 AI训练集群，算力惊人。官方数据显示，该集群的总算力相当于50万台PC。

　　ResNet-50模型训练被视为全球衡量AI计算能力的主要标准。华为轮值董事长胡厚崑告诉《中国经营报》记者，在最典型的ResNet v1.5训练模型中，Atlas 900用59.8秒完成了训练，排名世界第一，让原来的世界纪录提升了10秒。

　　“ImageNet-1K数据集”包含128万张图片、精度为75.9%，在同等精度下其他两家业界主流厂商的测试成绩为70.2秒和76.8秒，Atlas 900 AI训练集群的成绩比第二名快了15%。

　　在2018年全连接大会上，华为首次对外发布AI战略，当时只交付了可用于推理计算的昇腾310处理器和ModelArts应用平台。一年之后，华为先是于2019年8月23日推出当前全球算力最强的AI处理器昇腾910，接着又在9月18日推出Atlas 900 AI训练集群，从芯片硬核上搭建起了全栈全场景的AI计算能力。

　　发力AI计算产业的原因在于，华为预计，5年之后AI计算所消耗的算力将占到全社会算力消耗总量的80%以上，全球计算产业将进入新的智能时代。而Gartner的预测显示，到2023年，全球计算产业的规模将超过2万亿美元。

　　算力稀缺的挑战

　　众所周知，驱动AI发展的动力有三个要素：算法、数据、算力。其中，算法是否有创新发展难以量化跟踪，数据的巨大体量也难以计算，唯有算力可以量化。

　　业界甚至有言论认为，AI让摩尔定律起死回生，就是因为算力的强大作用。可以说，算力是AI发展的重要基石，因为重要的AI技术突破依然必须在足够的算力基础上才能实现。

　　而随着大数据、人工智能等新技术的应用，企业对于算力的需求不断飙升，传统计算产业亟待转型升级。统计数据显示，目前全球每年新增数据20ZB，AI算力需求每3.5个月就会翻一倍；该速度已远超摩尔定律关于性能翻倍的周期。按照摩尔定律，集成电路上可容纳的元器件数目大约每隔18~24个月便会增加一倍，性能也将提升一倍。也就是说，摩尔定律驱动的传统计算产业，已不适应大数据、人工智能的发展需求。另外，5G、物联网、边缘计算等新技术的崛起，也让算力面临更加多样化的现实需求。

　　正因为此，尽管如今算法效率不断提高、芯片技术高度发达，但依然面临着算力稀缺的挑战。OpenAI近期发布的研究报告显示，2012年至2018年，人们对于算力的需求平均每年增长10倍。尤其是进入5G时代，数据量将以爆炸式的情形增长，因为AI行业需要对数据进行更大规模的清洗、标注、训练。这意味着行业需要更长的时间进行运算，而算力不够将会导致AI发展速度的降低。

　　这也正是8月23日昇腾910发布时，华为另一位轮值董事长徐直军直言“AI研究遇到的最大困难就是缺少算力——AI本质就是暴力计算”的原因所在。

　　很多巨头公司和创业公司都看上了AI 芯片领域广阔的市场前景。因为根据Gartner的研究，AI芯片在2017年的全球市场规模为48亿美元，2020年预计将达到146亿美元，其中云端AI有望占到105亿美元。但问题在于，就产品而言，目前真正有市场优势的厂商凤毛麟角。

　　强悍的昇腾910

　　放眼全球AI芯片市场，当前华为昇腾910的优势较为明显，这主要体现在以下几个方面：

　　首先是生产工艺，昇腾910是一颗采用7nm+ EUV工艺技术的芯片，在工艺制造上属于当前全球最高水平。其次是芯片架构，昇腾910采用华为“Da Vinci（达芬奇）”架构。这属于华为自研架构，也是亮点之一。

　　再次是开源架构，昇腾910采用MindSpore架构，按照华为的说法，该架构将于2020年第一季度开源。MindSpore架构对标当前全球主流AI 框架Tensorflow 、Caffe、Pytorch等，华为并开源这一架构有助于业界开发更好的AI应用，并促进AI生态的发展。

　　最重要的一点在于，昇腾910是当前更强的AI芯片。其AI算力水平相当50个当前最新最强的CPU。其训练速度也提升了50%~100%。实测结果表明，在算力方面，昇腾910完全达到其设计规格——即半精度（FP16）算力达到256Tera-FLOPS，整数精度（INT8）算力达到512Tera-OPS。更为重要的是，达到规格算力所需功耗仅310W，明显低于设计规格的350W。

　　正是基于上述性能指标，徐直军才敢在发布会上表示：昇腾910的总体技术表现超出预期，作为算力最强AI处理器当之无愧。

　　昇腾910的横空出世更像是一个里程碑，作为全球已发布的单片算力最强的AI处理器，昇腾910恰恰是为AI应用而生。而基于昇腾芯片，华为面向人工智能应用和智能驾驶也分别推出了Atlas和MDC两个系列的产品，以推动普惠AI的目标落地。

　　其中，基于昇腾910和去年华为全连接大会推出的昇腾310，华为已搭建了全栈全场景的产品能力。华为智能计算业务部总裁马海旭告诉记者，基于昇腾芯片的Atlas 200系列可以内嵌在智能机器人等产品；Atlas 300系列真要用于AI训练；Atlas 500系列用于边缘计算的小站；Atlas 800系列是针对AI服务器的；Atlas 900系列也是针对AI训练的。而在搭建超强算力核心竞争力的布局中，华为不仅仅有昇腾芯片针对AI计算，还有鲲鹏芯片针对通用计算，“昇腾+鲲鹏”在底层硬核方面构成了华为在整个计算产业的核心能力。

　　相比较昇腾系列主打AI计算不同，华为鲲鹏920芯片主打通用计算，基于鲲鹏处理器打造的TaiShan服务器，其优势主要体现在高性能、低功耗上。这样一来就可以帮助企业更好进行大数据的即时处理和计算，从而为未来走向智能时代奠定基础。

　　基于外界对华为推进AI全栈全场景战略的预测，“服务器操作系统”何时推出也颇让人期待。在2019年全连接大会上，华为宣布将于今年底开源服务器操作系统EulerOS以及单机版的GaussDB数据库，以“硬件开放+软件开源”姿态为计算产业向前发展注入新的活力。

　　差异化的市场路径

　　徐直军在介绍昇腾芯片商业模式时曾经指出，“我们不直接向第三方提供芯片，而是提供基于芯片的硬件和云服务，我们和纯芯片厂商没有直接竞争。”

　　那么，消费者和企业如何才能用上华为的AI算力？事实上，全球市场中的各类AI芯片，基本上都是以板卡、服务器或云服务的方式提供给客户和合作伙伴的。华为也是如此。

　　华为公司智能计算产品线相关负责人介绍说：华为昇腾系列AI处理器将搭载于Atlas系列AI产品和云服务上，并随之推向市场。

　　前述Atlas 200、300、500、800、900系列产品都是基于昇腾AI处理器的系列人工智能计算产品，产品形态包括AI模块、加速板卡、边缘设备、服务器等，可分别应用于终端、边缘计算、云，覆盖全场景AI需求，让智能计算无所不及。目前，已有大量国内外企业搭载了华为Atlas系列模块和板卡，进行AI产品的开发。

　　据了解，Atlas人工智能计算平台支持业界主流AI计算框架，如谷歌的TensorFlow、Facebook的PyTorch/Caffe等，也支持华为最新的AI计算框架MindSpore。其中，MindSpore框架的特点是可以实现算法即代码，大幅降低AI开发门槛，同时也具备全场景应用优势，其与昇腾910的深度协同将全面发挥处理器的算力潜能。

　　目前全球范围内与昇腾910芯片相近的产品，主要由两家企业提供，一家是谷歌，另一家是英伟达。其中，谷歌只对外提供云服务，不提供板卡等。

　　与纯芯片厂商英伟达相比，华为不独立出售芯片，而是出售搭载了自研AI芯片的Atlas系列产品，与之形成差异化竞争。

　　与同样同时拥有AI芯片及云服务的谷歌相比，华为昇腾910的商业模式也存在差异化优势。因为“昇腾系列产品包括AI芯片和AI IP，其中Nano、TINY、Lite系列都是IP，既能嵌入华为自身芯片，也能嵌入其他所有需要AI能力的产品”。

　　基于华为昇腾系列AI芯片，通过模块、板卡、小站、一体机等丰富的产品形态，华为打造了面向“端、边、云”的全场景AI基础设施，可广泛用于智慧城市、运营商、金融、互联网、电力等领域。

　　华为发布的《全球产业展望GIV 2025》预测，到2025年，大企业AI普及率将达到86%。因此，华为开始在计算领域全面发力，并致力用芯片、AI和架构创新等技术，为客户提供强劲算力、云边协同、全场景覆盖、一体化的计算解决方案。

责任编辑：张国帅

我要反馈