银行大模型研发算力瓶颈如何破局？_新浪财经

　　21世纪经济报道记者陈植上海报道

　　今年以来，越来越多国内银行积极拥抱大模型技术，并将其广泛应用在众多金融场景。与之同时，算力瓶颈正成为布局大模型技术的一大挑战。

　　“算力的基础，是先进的AI芯片。但由于美国限制对华出口先进的AI芯片（包括GPU芯片），国内银行在研发金融大模型方面普遍遇到算力瓶颈。”一位股份制银行IT部负责人向记者透露。

　　记者多方了解到，为了解决算力瓶颈挑战，众多银行各显神通。

　　具体而言，大型银行干脆直接自建算力，尽管这种做法的成本投入相当昂贵，但好处在于银行具有较高的自主性与安全性，还能根据自身业务需求“定制化”地研发金融大模型。

　　中小银行则纷纷试水算力混合部署，即他们先在公有云的基础上，调用大型互联网企业或电信设备服务商的大模型算力服务接口，再通过私有化部署的方式开展自有数据的大模型预训练。

　　“目前，中小银行已形成相对成熟的云+算力服务方案，主要是引入大型互联网企业与电信设备服务商的算力资源，解决前者的大模型数据预训练与调优工作。”一位中小银行信息科技部主管向记者透露。

　　在他看来，随着大模型迭代频率加快，加之AI Agent与多模态入参等新兴大模型业态的兴起，银行需要更强大的算力支持，才能赶上大模型技术的最新发展应用趋势。尤其在美国限制对华出口先进AI芯片的情况下，银行仍需寻找更具稳定性与安全性的算力解决方案。

　　记者多方了解到，目前部分银行已尝试通过分布式架构与算法优化，将美国先进AI芯片与国产AI芯片进行整合形成新的算力聚合，在解决算力瓶颈同时实现算力“自主化”。

　　此外，部分地方政府也在积极搭建“算力池”，为众多企业研发行业大模型提供“底层算力支持”。

　　“我们正密切关注地方政府的算力池具体使用规则，或许它是银行迭代金融大模型过程的新型算力解决方案。”上述中小银行信息科技部主管告诉记者。但在实际操作环节，这项工作仍面临诸多挑战，包括如何遵守“数据不出行”的合规操作要求，如何有效避开众多企业的算力资源争夺等。

　　部分中小银行IT部门人士建议，相关金融监管部门不妨建立一个面向银行等金融机构的算力池，供不同规模银行开展金融大模型数据预训练，如此既能解决众多银行普遍遭遇的“算力瓶颈”，又能尽可能缩小大模型技术所带来的银行之间金融服务“落差”。但是，谁来出资购买或租赁算力，如何做好算力分配，如何搭建匹配不同银行调入接口的底层基础设施，都面临一定的实际操作挑战。

　　不同规模银行的差异化解决方案

　　记者获悉，目前有能力自建算力的，主要是国有大型银行与部分股份制银行。

　　究其原因，这些银行已储备一定数量的先进AI芯片，广泛用于自身金融大模型数据预训练。

　　“考虑到单颗先进AI芯片价格相当昂贵，若要储备一定数量的芯片，将是一笔不小的开支，这也只有大型银行与部分股份制银行有能力做到。”前述中小银行信息科技部主管告诉记者。他还听说个别大型银行已将先进AI芯片作为重要的算力资源进行储备。

　　与此对应的是，大型银行在自研金融大模型方面的步伐更快。

　　一位大型银行IT部人士向记者透露，目前他们已建立了异构的GPU算力资源池，并基于云服务部署实现算力灵活调度。

　　“这让我们很快基于算力算法，构建了基础大模型、金融行业大模型与场景大模型。”他直言。目前这些大模型已广泛应用在智能客服、文本生成、辅助研发、智能投顾、智能催收、大数据风控等场景。

　　他坦言，受美国限制对华出口先进AI芯片影响，加之银行内部金融大模型迭代速度加快，他们也发现自身的GPU芯片正在快速“消耗”。因此他们也尝试与一些大型互联网企业开展算力合作——比如共同构建算力集群与计算网络存储等底层基础设施，进一步借助外部算力资源开展金融大模型的调优迭代工作。

　　一位股份制银行IT部人士对此感同身受。

　　他透露，银行此前储备的一批先进AI芯片主要用于搭建千亿参数级别大模型与图像识别NLP等领域，目前所剩的算力资源不多，但随着多模态入参与AI Agent等大模型新发展趋势的兴起，银行需要更强大的算力资源支持。因此他们也在尝试与大型互联网企业与电信设备服务商开展合作，引入他们的算力资源研发新的大模型技术。

　　相比而言，绝大多数中小银行基本采用算力租赁或算力混合部署等方式，解决自身研发大模型技术的算力瓶颈。

　　“目前，我们主要通过租赁大型互联网企业的算力资源（即通过云端部署调用后者的算力）开展银行内部数据的大模型预训练，但每年这项算力投入仍达到数百万元。”前述中小银行信息科技部主管向记者坦言。因此他每年需向银行高层证明大模型技术在智能客服、智能投顾、文本生成、辅助研发等场景发挥日益显著的降本增效作用，才能说服他们同意继续追加算力租赁投入。

　　他告诉记者，为了尽可能减轻算力成本投入，他们正考虑研发轻量级的大模型，即在第三方金融科技平台所研发的大模型产品基础上进行调优与场景适配，再结合银行内部数据的预训练成效，研发适用特定任务或特定场景的大模型，如此既能有效减少数据预训练工作量与算力投入，又能省去不少大模型研发方面的“重复性工作”。

　　记者了解到，为了进一步节省算力投入，部分中小银行还采取“大模型+小模型”的做法推进大模型技术在金融场景的应用。具体而言，一是大模型起任务分解和调度作用，通过大模型调度小模型，可以实现更智能化的工作并减少海量数据预训练所带来的算力投入；二是由大模型对特征向量化进行赋能，进而替代小模型所需完成的特征工程工作，也能减轻不少算力投入。

　　在多位银行人士看来，尽管众多银行采取诸多措施解决算力瓶颈，但在金融大模型迭代速度越来越快与大模型技术日新月异的趋势下，要真正解决算力瓶颈，最好的办法是积极拥抱国产AI芯片。

　　目前，部分银行已尝试引入国产GPU芯片，作为他们进一步研发金融大模型的新算力资源支持。

　　但是，由于国产GPU芯片与美国先进AI芯片采取的技术路线与软件生态有所差别，加之国产GPU芯片仍在进一步提升算力性能，如何将国产GPU芯片适配现有的金融大模型研发技术架构，仍需花费一定的工作量与时间。

　　试水地方政府算力池“成效几何”

　　为了解决众多企业研发行业大模型的算力瓶颈，近期不少地方政府也在积极搭建“算力池”。

　　这也引起多家银行的浓厚兴趣。

　　“若能通过地方政府的算力池解决数据预训练问题，或将加快我们金融大模型的迭代升级进程，让大模型技术更好地应用在更多金融场景。”上述中小银行信息科技部主管向记者感慨说。

　　但他很快发现，这项工作所面临的最大挑战，就是如何做到“数据不出行”。

　　以往，他们与大型互联网企业开展算力租赁合作时，都是由后者在中小银行本地部署大模型数据预训练所需的算力资源，如此银行使用本地部署的算力资源进行海量数据预训练时，就不存在“数据出行”的烦恼。如今，如何在“数据不出行”的情况下，又能引入地方政府的算力池算力资源，目前他们正在研究合规的可行性操作方案。

　　“与此同时，我们也在评估地方政府算力池的使用性价比，万一其他企业占据较大的算力资源，我们就得重新评估使用剩余的算力，能否有效解决自身金融大模型迭代升级所需的数据预训练算力需求。”他直言。此外，银行高层还希望地方政府算力池所设定的算力租赁费用能够显著低于第三方互联网企业，给银行研发迭代金融大模型创造更好的降本作用。

　　记者获悉，算力瓶颈正影响众多银行对大模型前沿技术的应用进程。

　　一位城商行IT部负责人向记者透露，他们也注意到AI Agent业态日益火热，且银行高层也认为AI Agent大模型技术能在众多金融场景发挥更智能化的服务成效，但受制于算力瓶颈，目前他们不大会对这项前沿大模型技术开展探索性研究。

　　AI Agent也被称为AI智能体，与LLM属于截然不同的两个概念，LLM本质就是大语言模型，包括GPT、GLM等基于自然语言处理且参数量巨大的生成式预训练大模型，但AI Agent侧重于AI与环境互动、并根据当前环境特征，由AI自主决策并采取行动。

　　某种程度而言，LLM是通往AI Agent的关键一环。但目前AI Agent尚未成熟，存在不少错误与问题。但可以预见的是，若AI Agent技术日益成熟并形成各种实践应用，是可以帮助金融机构更高效、低成本地使用AI技术。

　　记者多方了解到，目前国内众多银行尚未研发AI Agent这项前沿的大模型技术，不仅仅是受制于算力瓶颈，还有着合规操作的考虑。毕竟，国内金融机构对数据使用的监管要求相当严格，令他们更倾向将LLM大语言模型应用在众多金融场景。究其原因，是开源的LLM大语言模型技术既可以在本地环境进行部署，且能够更好地控制与管理数据以满足监管要求。在使用LLM大语言模型过程，金融机构也可以落实更高的合规性和安全性要求，包括数据隐私保护、数据加密和访问控制等。相比而言，由于AI Agent技术尚不成熟，加之金融机构对业务数据准确性与业务合规性的高要求，因此AI Agent仍较难被纳入实际业务场景，只能在银行内部某些基础、简单、通用、不涉及用户数据外泄风险的应用层面使用。

　　多位中小银行人士直言，随着AI Agent技术日益成熟，加之数据加密调取技术的不断进步、未来他们或将引入AI Agent大模型技术，尝试应用在更多金融场景，因为AI Agent的确能发挥更强大的智能化服务与降本增效作用。但这项工作能否开展的一大前提，是银行能否构建自主的、安全性、稳定的、强大的算力资源以支持AI Agent等前沿大模型技术的研发应用。