《中国金融》｜优化算力管理支持金融发展|芯片_新浪财经

转自：中国金融杂志

导读：提高算力利用效率既需要依靠市场资源的配置功能，让算力资源流向数据和人才密集型企业，又需要形成社会共识，不能以“大跃进”的方式开展大模型训练

作者｜李艺轩　李新华　冯帆「国泰君安证裕投资有限公司；中国建设银行上海大数据智慧中心；中国农业银行数据中心」

文章｜《中国金融》2024年第14期

算力是集信息计算力、网络运载力、数据存储力于一体的新型生产力。2023年10月末召开的中央金融工作会议指出，做好科技金融、绿色金融、普惠金融、养老金融、数字金融“五篇大文章”，为牢牢把握推进金融高质量发展主题、做好金融工作指明了方向。从实践上看，由于金融行业是数据密集型行业，金融机构日常需要大量算力来开展数据分析，以此来响应市场变化和客户需求，推进自身数字化转型进程，提升自身金融服务能力和风险管理水平。因此，如果没有充足算力，不仅做不好数字金融这篇大文章，也难以在其他四篇文章上取得长足进展。

我国算力供应问题突出

未来，金融行业对于算力的需求将快速提升。国际数据公司（IDC）数据显示，2021年全球新增数据总量达到84.5ZB，预计到2026年全球新增数据总量将达到221.2ZB，2021～2026年的年复合增速将达到21.22%，数据规模的快速增长必然对算力的供给提出更高要求。更为重要的是，当前AI大模型的发展正在重塑金融机构展业模式，这极大地提升了金融机构对于算力的需求规模。IDC最新一项调研显示，超半数的金融机构计划在2023年投资生成式人工智能技术，只有10%的金融机构表示没有试验计划。通过将AI大模型的内容生成涌现能力运用于智能营销、客服、投顾、投研、风控等场景，金融机构有望实现降本增效，客户也能获得更多优质的金融服务来满足个性化和定制化需求。AI大模型等新兴智能领域对算力的要求远超图像识别和语音识别等传统人工智能领域，因为大模型的参数量和复杂程度呈现出指数级增长，并且上述应用场景对于数据的实时性也有较高要求，所以使得算力资源变得愈发重要。

目前，全球范围内面临算力短缺的问题。算力主要通过算力基础设施为社会提供服务，算力基础设施是集信息计算力、网络运载力、数据存储力于一体的新型信息基础设施，可实现信息的集中计算、存储、传输与应用。当前算力基础设施的主要载体是数据中心，以ChatGPT为例，根据测算，其总算力消耗约为3640PF-days，需要7～8个投资规模30亿元、单体算力500P的数据中心才能支撑运行，而OpenAI预计全球大模型训练所需的算力将呈指数级增长，平均每3.4个月便会增长一倍，及时弥补大模型所需的算力已演变成一个世界级难题，需要各方的共同努力。

在此背景下，我国的算力短缺问题更为突出。数据中心的核心组成部分是服务器，其主要部件包括CPU（人工处理器）、GPU（图形处理器）板组、内存、存储器、网络接口卡、机箱、主板、散热系统和电源。在训练大模型时，GPU是AI服务器中价值量最高的部件，因为其承担了大部分的计算任务和深度学习模型的训练与推理工作。目前绝大部分厂商都依赖英伟达的GPU来进行大模型训练，但由于某些原因英伟达较为先进的A100和H100 GPU被美国商务部阻止进入我国市场，其面向中国市场定制的低配版A800和H800 GPU也在晚些时间被宣布禁售。面对这一问题，国内厂商尝试多种解决方案，以通过“转口贸易”获取芯片和国产替代解决方案为主。例如，华为海思、寒武纪等公司采用了不同的技术路线，基于差异化的架构设计出了昇腾、思元等芯片，但据从业者介绍，这些芯片虽然达到“能用”标准，但离实现对英伟达芯片的完全替代还面临诸多挑战。

除了算力供给短缺，我国还面临算力资源分散而导致的使用效率偏低问题，这项问题制约了我国人工智能技术的发展。生成式人工智能技术的快速发展，导致众多围绕算力资源炒作、造势、圈钱的现象出现。一些从未涉及算力领域的公司开始跨界算力租赁，购买大量服务器出租获利，进一步推动了算力资源价格上涨。

金融机构落地大模型面临多重挑战

大部分金融机构的预算不足以支撑自身采购大量算力资源训练大模型。尚且不考虑芯片可得性的问题，目前国内一块H800的芯片最新售价超过20万元，如果要深度训练一个10B级别的中等模型保守估计至少需要100张H800芯片，则购置成本大概在2000万元以上，如果选择租用芯片，单次的训练费用也将近100万元。除了购置或者租用芯片外，还要考虑配套设施的改造，目前大部分数据中心机房的供电功率都不足以支撑装载较多GPU芯片的机柜运行，数据中心的网络基础设施、液冷系统也同样面临重新规划和改造问题。

大模型落地应用是系统性工程，单纯堆积算力并不能取得良好效果。在现实商业环境下，大模型需要具备丰富的专业知识和较高的安全性、可靠性。例如，当客户要求大模型推荐一只收益高且稳赚不赔的金融产品时，大模型应该进行必要的风险提示和情况说明，而不是一味推荐产品。在金融投资领域，风险收益和流动性往往不可兼得，但目前绝大多数通用大模型并不能理解这一常识，也无法有效规避此类“合规陷阱”。此外，大模型目前的强项在于自然语言的理解和输出，然而一旦涉及复杂决策问题，其表现出的推理和逻辑能力不尽如人意，难以在资产配置、风险管理、深度投研等领域发挥作用。为了能让员工和客户在体验大模型带来的泛化通识能力的基础上，降低对专业性和合规性风险的担忧，金融机构不仅需要充足的算力来对实时更新的金融语料和数据进行训练，还需要建立健全大模型训练的配套机制，包括打造专业人才团队对算法更新迭代、对涉及价值观和法律的问题进行必要的人工干预、设计不同情景下调用其他外部工具和应用的方案等。

多措并举优化算力资源管理

当前，亟须政府和业界共同努力来优化算力资源管理，为金融行业高质量发展提供坚实保障。从直接扩大算力供给的角度看，建议出台更多的支持政策。一是建议出台一系列财政资助和税收优惠政策。包括为致力于算力基础设施建设、维护和升级的企业和研究机构提供直接财政支持，以及为投资算力资源的企业提供所得税、增值税等税收激励措施。此外，对于从事算力相关研发活动的企业，政府可以提供研发费用加计扣除等税收优惠，以鼓励更多的技术创新；对于开展算力技术创新、新产品开发和应用示范的项目，政府应给予一定比例的研发补贴，支持算力相关的基础研究和应用研究，鼓励跨学科、跨领域的合作。二是建立和完善算力资源共享平台，以促进公共算力资源的高效利用。一方面，算力资源共享平台的资源池化不仅可以显著降低各参与方的成本，还能提高算力的整体利用率。平台的设计应当支持中心化或去中心化的网络架构，以适应不同使用场景和需求，同时确保资源的可靠性、安全性和易用性。通过引入先进的算法优化和智能调度技术，平台能够根据具体的任务需求，自动匹配最适合的算力资源，提升资源利用效率。另一方面，算力资源共享不仅能促进参与方之间的技术交流和合作，加速算力技术的创新和应用，还有助于形成一个健康、活跃的算力资源生态系统，为科研创新和产业发展提供强大的支持。三是推动技术标准化和生态系统建设。制定和推广与算力相关的技术标准，以促进不同技术之间的互操作性和兼容性，有效降低技术壁垒。同时，支持开源算力技术的发展至关重要，应鼓励企业和研究机构积极参与开源项目，通过共享资源和知识，共同推动算力技术的创新和应用，为经济社会的数字化转型提供有力支持。

从提高算力利用效率的角度看，一方面要靠市场的资源配置功能发挥作用，让更多的算力资源流向数据和人才密集型企业；另一方面也需要形成社会共识，不能以“大跃进”的方式开展大模型训练。基于此，建议金融机构不要过度囤积算力资源，而是考虑和通用大模型厂商、金融信息和数据服务商一起合作训练。具体而言，通用大模型厂商提供基座并负责版本的迭代更新；金融信息和数据服务商负责维护更新公共金融语料库并对基座进行增量改造，开发相应的外部数据调用工具。金融机构只要日常维护更新好自身的金融语料和数据，在设计好安全机制的前提下，将自身的数据库和外部调用工具相链接，就能让员工和客户在各个办公和业务场景中体验到通用大模型在普遍性知识和基于常识的推理能力上的优势，以及金融垂直大模型在财经领域的专业性和基于实际业务实践的定制化服务。例如，在智能投研场景中，证券公司的客户想要了解一家上市公司股票的投资前景，大模型厂商提供的是该公司所处地理位置、创立时间、主营业务等基本信息，金融信息和数据服务商提供的是该公司的公开信息，如财务报告和互联网相关舆情的总结归纳，而证券公司提供的则应是包含该公司盈利预测和估值在内的投资评级。这种合作模式的好处不仅在于通过整合三方专业能力和资源共同服务好客户，还在于可以最大限度地节约算力资源，大幅降低金融机构使用大模型的成本，未来有望成为金融使用大模型的主流模式。■

（责任编辑张一帆）