永信至诚AI“数字风洞”团队测评国内外主流AI大模型 DeepSeek-R1位于前列|AI_新浪财经

上证报中国证券网讯近期，永信至诚依托生成式人工智能（AIGC）加持的春秋AI测评“数字风洞”平台，基于“数字风洞ISAC24”测评标准，对国内外主流AI大模型进行测评。最终测评数据显示，DeepSeek-R1在综合测评成绩、智能度和匹配度上均领先于Llama3.1、GPT-4o-Mini以及其余被测模型，在回答的一致度上位于前列。

测试期间，永信至诚从企业的应用实际出发搭建测试环境，加载40万余条兼容多个国际测评标准的测试数据，面向DeepSeek在内的国内外主流AI大模型的智能度（Intelligibility）、安全度（Safety）、匹配度（Applicability）、一致度（Consistency）等方面设计了“数字风洞ISAC24”测试标准，并挑选了客户可能会“选择困难”的国内外AI模型作为横向测评对象，试图找到10万预算以内“最适合企业用户的基座模型”。

测试结果显示，尽管DeepSeek-R1展现出较大优势，但安全度方面有待加强，需要在后期的应用框架方面增加安全防护和内容过滤。

此外，永信至诚也进行了初步测算，部署DeepSeek-R1-Distill-Qwen-14B的整体解决方案市场价不超过10万元人民币，基本符合大多数企业客户的初期预算和日常需求，并且它充分开源和完全商业授权的开源策略，让更多研究人员和企业都可以基于DeepSeek-R1的训练过程进行复现和深度开发。（白丽斐）