百川智能发布金融大模型Baichuan4-Finance,准确率领先GPT-4o近20%

百川智能发布金融大模型Baichuan4-Finance,准确率领先GPT-4o近20%
2024年12月23日 14:34 新浪财经

  新浪科技讯 12月23日下午消息,百川智能宣布发布全链路领域增强大模型Baichuan4-Finance。据悉,在高质量金融数据的基础上,Baichuan4-Finance实现了金融能力和通用能力同步提升的效果,极大提高了金融场景的整体可用性。其金融专业能力和场景应用能力均领先GPT-4o。

  在中国人民大学财政金融学院新近发布的评测体系FLAME评测中,该模型登上榜首。具体来看,FLAME由两个方向的评测基准组成:一,FLAME-Cer主要面向模型的专业金融能力评测,覆盖了CPA、CFA、FRM等14类权威金融资格认证;二,FLAME-Sce则侧重模型的场景应用能力,包含10个一级核心金融业务场景,21个二级细分金融业务场景,近百个三级金融应用任务。

  在FLAME-Cer评测中,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率93.62%,大幅领先GPT-4o和XuanYuan3-70B-Chat,超出GPT-4o近20%。GPT-4o是金融领域公认的综合实力最强的通用模型之一,而XuanYuan3-70B-Chat则是国内首个开源中文金融大模型。

  在FLAME-Sce评测中,Baichuan4-Finance一级核心金融业务场景的整体可用率达84.15%,其金融数据计算、金融知识理论等场景的可用率更是超过90%,实际应用场景中的表现非常优秀。

  此外,为让模型在提升专业能力的同时不损失通用能力,该模型还打造了一套全链路领域增强方案,覆盖高质量数据集构建、模型预训练、微调、强化学习等从模型研发到场景应用的全流程,实现了模型专项能力和通用能力同步提升,提升了模型多元场景可用性。(文猛)

海量资讯、精准解读,尽在新浪财经APP

责任编辑:石秀珍 SF183

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 12-30 钧崴电子 301458 --
  • 12-30 赛分科技 688758 --
  • 12-24 星图测控 920116 6.92
  • 12-23 黄山谷捷 301581 27.5
  • 12-20 天和磁材 603072 12.3
  • 新浪首页 语音播报 相关新闻 返回顶部