王晓航：大模型升级金融产业全链路_新浪财经

　　2023年12月14-15日，第二十届中国国际金融论坛在上海成功举行。蚂蚁集团副总裁、蚂蚁金融技术委员会主席、蚂蚁金融的大模型负责人王晓航应邀出席并发表了题为《大模型升级金融产业全链路》的主旨演讲。在演讲中，王晓航表示，大模型作为新一轮AI浪潮的焦点，正在金融领域催生一个全新的AI应用范式，推动行业用户体验和生产效率的提升。然而，金融作为专业严谨、安全性和合规性要求高的行业，在大模型落地的“最后一公里”面临着多重挑战。他认为，大模型无法开箱即用，在金融产业中的落地是一个复杂的系统工程。为确保可靠性，大模型的应用需要进行专业增强、知识增强、检索增强和安全增强等方面的工作，并需要全周期的强化，包括数据治理、价值对齐、风险识别、知识增强以及攻防对抗等领域的工作。

　　以下为演讲实录：

　　王晓航：各位领导，行业的同仁，大家好！很荣幸参加第二十届中国国际金融论坛。

　　在近期的中央金融工作会议中，提到了包括数字金融在内的五大篇章，前面听到各位领导和行业同仁对数字金融发展的机遇和风险的讨论，对此我收获颇多。现在我代表蚂蚁，从金融科技实践者的角度，向大家介绍我们在数字金融领域的AI应用实践，特别是围绕金融大模型的产业动态。

　　深耕金融智能，迎接产业产业智能化新拐点

　　金融行业对大模型技术寄予了厚望，并将其定位为一次产业技术革命。然而，要实现技术变革并产生规模化的价值，并非一蹴而就，通常需要经历阶梯式发展过程。在大模型的应用落地之前，我想与大家回顾金融行业人工智能应用的发展历程。

　　作为普惠金融的实践者，蚂蚁一直处于人工智能和金融结合的最前沿。早在2013年，蚂蚁就推出了余额宝和小微金融等一系列国民产品，这是金融领域首次拥抱规模化互联网，为人工智能的能力展现创造了巨大空间。在那个时候，蚂蚁创造了小微金融310模式，通过AI解决了小微长尾客户的风险防控问题，初步展示出金融人工智能的普惠价值。

　　到了2017年左右，数字金融领域开始采用开放平台模式。以蚂蚁财富、蚂蚁保、网商银行为代表的数字金融平台以更开放的姿态连接行业机构，为平台上的大量用户引入丰富且优质的服务和产品。在这一阶段，数字金融全面智能化，人工智能开始广泛应用于各种业务场景，成为营销、服务、投研、风险管理和资产管理等业务降本增效的关键手段。在此期间，蚂蚁积累了超过300个金融人工智能应用，线上运行着超过2000个专业AI模型，为下一阶段的产业智能化奠定了坚实的基础。

　　2023年，在AI技术和算力长期积累的基础上，我们迅速自研了大模型技术，并转向大模型带来的新应用范式。大模型落地金融领域过程中，它展现出了深度和速度两个显著优势。在深度方面，大模型具备出色的语言、认知、推理和交互能力，在各种多元金融场景任务中不断刷新前沿技术水平（SOTA），逐渐接近或达到人类专家水平。例如，在研报解读和市场分析方面，已经达到了媲美初级或中级分析师的水平。在速度方面，大模型将算法架构大一统，极大降低了人工智能的开发门槛和成本，促使更多的智能化创新在各个领域和场景中广泛涌现，并形成了爆炸式的技术浪潮。

　　在大模型时代，我们认为金融智能的前景更加广阔，趋势也更加明确。

　　金融服务链条上的关键环节，都值得用大模型重做一次

　　以金融大模型在蚂蚁的应用全景为例，我们全栈自研，推出蚂蚁金融大模型，并搭建了一个较为成熟的产业化应用基座 —— 以大模型为认知和交互的中枢，连接用户金融意图与业务场景，精准地调用金融专业知识和服务能力。通过这个“大模型 + 知识增强 + 服务增强” 的框架，为广泛的金融应用场景提供语言力、知识力、专业力、以及AI可靠性的支撑。

　　一、金融大模型与客户洞察结合。面向金融消费者，我们引领服务智能，打造人人都有的智能金融助理；面向理财顾问和保险顾问，我们引领销售智能，为理财顾问和保险代理人量身定制生产力应用，提高专业水平和销售服务半径；面向数字化运营，我们引领营销智能，带来更精准的供需理解，更多元化的表达，突破创意和效率空间。

　　金融大模型与金融专业相结合。面向金融产业中的大量中后台从业者，如投研分析师、风险策略专家、精算师等等，他们日常工作中大量时间会花费在信息提取、定性分析和量化编码等基础工作上，大模型能够很好地承担这部分初中级的自动化工作，让他们更加聚焦在创造性和专业深度的工作。

　　金融大模型与隐私计算相结合。面向金融机构泛生态，通过联合理赔、联合风控、联合营销等一系列的技术，让中小金融机构也能够享受到数据互联互通的技术红利，实现可持续运营和发展。

　　蚂蚁金融大模型，解决产业真命题

　　蚂蚁金融大模型从诞生的第一天开始，我们的定位就是要立足于产业，解决产业中的真实命题。

　　今年9月，在上海外滩大会，我们发布了蚂蚁金融大模型及ToC和ToB的两个应用产品，我们称之为1+2。蚂蚁金融大模型具备更好的金融通识，在五大类28维度的金融任务评估中，相较通用大模型，有非常突出的性能和效果提升。在发布的早期，就已经通过了等同于证券从业、保险从业、精算，以及保险医疗领域的执业医师、药师从业等一系列准入资格考试。近期，蚂蚁金融大模型团队沉淀了一系列的金融智能体，它拥有链接和规划的能力，不仅能够与真实的产业环境进行连接，还能遵循定制的业务规则和策略，自主进行规划和执行。

　　请允许我展开介绍一下我们的ToC应用，支小宝2.0。支小宝在大模型问世前就上线了，曾经是小模型时代理财服务行业的翘楚，是为年轻一代的金融消费者提供的互动式智能理财助理。目前，在蚂蚁金融大模型的加持下，支小宝2.0大幅提升了语言力、知识力、以及学习使用专业顾问工具的能力。

　　在金融资讯和金融知识通识方面，支小宝2.0可以做到有问必答，保障95%以上端到端的准确率的同时，事实率接近100%。对比主流的通用大模型，双盲对比胜率达到80%以上，显著得到了大模型技术带来的技术红利。同时，用户可以通过简明的自然语言，无感流畅操控支小宝2.0背后的300多款数字化专业工具，并获得定制化、个性化的服务方案，如基金选品、资产配置、保障配置等等。支小宝2.0已经在蚂蚁的理财和保险业务上已经进行了半年多的深度测试，我们期待支小宝2.0尽快与大众用户见面，给各位带来更好的交互式体验。

　　支小助，是我们面向金融从业者打造的智能业务助手，这是一个系列产品。下面，我以投研支小助为例展开介绍。

　　投研分析师的工作模式，在过去的20年时间里并没有发生特别大的变化。从2000年初开始，以彭博为代表的金融信息服务商，为金融分析师开发了一整套工具生态。但是直到2023年的今天，投研分析师的分析工作，还是以手工为主。金融大模型强大的推理能力，结合大规模的世界级的金融知识工程，使我们首次具备了在这个行业里实现质变的技术前提，我们第一次看到“通过AI驱动的智能化分析”媲美初级分析师的可能性，并立即着手展开实践和落地，并推出了代表性作品——投研支小助。投研支小助的硬核科技有两大秘籍，一是自动量化编码（NL2Quant），通过自然语言形式自动生成代码和图表。在基础的信息提取、数据处理、业绩回撤等量化分析工作上，预计一年内可减少投研分析师70%左右的工作量，让他们可以聚焦在更有创造性和高价值的工作事项。二是智能体协同技术，面向定性分析，它可以遵循专家所定义的各种细分品类的研判框架，把信息收集、推理、分析、写作以及评估审核全部包办。在投研支小助强大能力的武装下，蚂蚁各部门的普通工作人员，从前台的理财顾问、资讯编辑，到后台的工程师、分析师等角色，能够在定制化的财报解读、研报解读、行业政策解读等十多个专业品类的分析框架帮助下，达到初级或中级分析师水平。

　　大模型落地金融产业，是复杂的系统工程

　　在上述的介绍中，主要是金融大模型带来的具有代表性的一系列行业案例，以及落地实践状况。其实我们都认识到，在金融这样专业且严谨的产业，通用大模型无法实现 “开箱即用”，我们认为，大模型落地金融行业，需要克服领域知识短板、复杂决策短板、可靠性短板等三个方面的挑战。

　　首先是金融领域的知识短板。通用大模型有效地压缩了万亿量级token的世界知识，通识强大，但在金融领域的通识是相对薄弱的。所谓领域通识，是对某一个专业领域基本原理的理解，而不仅仅是名词解释。比如在金融领域，一个初级通识的案例：对于一项金融资产，它的流动性、收益和风险构成“不可得三角”。但是，如果我们向通用大模型提问，“给我推荐一只包赚不赔、收益很高的理财产品”，它无法可靠理解金融通识，更谈不上正确引导投资风险和流动性等等专业性意见。此外，通用大模型还存在很多短板，比如无法实时更新金融信息，无法实时把握市场动态等。

　　其次是金融决策的复杂性短板。打个比方，通用大模型是个优秀的“文科生”，理解能力、语言能力、推理能力超群，可惜在复杂决策和数学方面差强人意。然而，在关乎金融本质的决策链路上，我们更需要严谨的“理科生”。我们无法把一个家庭资产配置方案或保障配置方案，简单托付给通用大模型，也不建议通用大模型现阶段贸然涉足严肃的金融业务。在大模型能力成熟、责任边界清晰前，金融科技需要安全审慎前行。

　　第三个短板是可靠性，即大模型的幻觉与金融的严谨性之间存在冲突，金融领域的大模型发展之路遍布可靠性缺失的荆棘与陷阱。比如“一个用户是否可以购买某一个金融产品”这样一个看似简单的命题，背后蕴藏了一个“合格投资者认证”的判别问题。金融行业领域的可靠性不仅限于合规，还包含内容安全性、事实性、实时性、科技伦理和金融价值观等方面。

　　为了有效补齐上述短板，让大模型技术安全可靠地落地金融场景，除了对通用大模型注入金融通识和私域知识，还需要一套系统工程解决方案，通过有效的技术组合，跨越鸿沟。

　　首先是专业增强，大模型要能与专业领域的小模型协同。大模型在感知、认知和交互领域具有显著优势，而各个专业小模型专注于特定问题或任务，在特定领域（运筹、量化、图算法）表现更为优异。在实际应用中，我们可以将大模型作为认知和交互的中枢，而小模型则负责专业判断和决策，通过大模型调度小模型共同完成复杂的推理和决策工作。

　　第二是知识的增强，实现大模型隐性知识与图谱显性知识互补。大模型通识覆盖广，但不够严谨可靠，容易出现幻觉和答非所问的现象。相比之下，图谱显性知识专业性和可靠性强，但生产维护成本较高。鉴于金融领域的头部问题是收敛的，应用中可用图谱覆盖严谨性和价值双高场景（比如主流保险产品的条款，核保核赔知识），大模型覆盖低频和长尾场景，以实现服务质量与服务成本的平衡。

　　第三是检索的增强，当面临一个需要严谨回答的问题，可以转化为“检索增强”问题：先从专业可靠的内容中进行检索，再基于检索结果做金融级推理和解答，以提升答案的可靠性。该过程，就像是让大模型先找到一本金融教科书，再在书籍中去寻找、理解，并生成简明扼要的答案。

　　最后是安全增强，确保大模型安全性、可靠性、合规性。大模型落地金融产业，最大挑战就在于可靠性，这是行业共识的。刚才各位领导的发言也提到，科技发展带来机遇的同时，也需要有效防范风险，可靠性至关重要。虽然上述三个技术组合可以有效弥补大模型的不足，但在消费级金融应用方面仍有待提高。蚂蚁在为数千万消费者提供服务的过程中，积累了丰富的安全和合规技术，构建了一套全生命周期的、立体化的、可靠性加固技术，以确保大模型的训练和推理过程的可靠性：

　　（1）在训练阶段，源头的数据治理是关键。在金融领域，我们需要“高大正”（高质量、大规模、价值观正确）的数据。中文世界约有2000亿token的金融语料，然而通过模型和人工的层层清洗和筛选，我们认为最终能够达到高质量高标准的语料，只有10%左右。在金融领域，质量比数量更重要，我们需要在源头上保障大模型的学习质量和价值取向。此外，我们在训练阶段需要通过“精调和对齐”技术，确保大模型的价值取向正确。

　　（2）在线上推理阶段，蚂蚁为金融大模型设立了专用安全围栏：在请求和生成两端都进行严密的风险判别和拦截。这个系统称为“蚁鉴”，由数百个识别模型和数十万判别规则组成。同时，我们通过模型和人工结合方式，建立了数百万的负向样本，在模型上线前后，持续自动化攻击金融大模型可能存在的可靠性薄弱点，检测安全能力。

　　通过一系列安全与合规技术的加固，蚂蚁金融大模型在金融可靠性评估的各个维度达到99%以上，已能媲美人类专家，具备了对消费者开放的可靠性条件。

　　最后简单总结，大模型落地金融产业最后一公里，几个关键点：

　　（1）不存在“开箱即用”，大模型落地金融产业需要经历专业增强、知识增强、检索增强和安全增强一系统复杂工程；

　　（2）大模型满足可靠性，需要全周期强化，从数据治理、价值对齐、风险识别、知识增强、到攻防对抗；

　　（3）金融Agent，遵循专业策略框架，调用专业知识和工具，独立且协同，解决复杂产业问题。

　　谢谢大家。

股市回暖，抄底炒股先开户！智能定投、条件单、个股雷达……送给你>>