
上证报中国证券网讯近期,永信至诚依托生成式人工智能(AIGC)加持的春秋AI测评“数字风洞”平台,基于“数字风洞ISAC24”测评标准,对国内外主流AI大模型进行测评。最终测评数据显示,DeepSeek-R1在综合测评成绩、智能度和匹配度上均领先于Llama3.1、GPT-4o-Mini以及其余被测模型,在回答的一致度上位于前列。
测试期间,永信至诚从企业的应用实际出发搭建测试环境,加载40万余条兼容多个国际测评标准的测试数据,面向DeepSeek在内的国内外主流AI大模型的智能度(Intelligibility)、安全度(Safety)、匹配度(Applicability)、一致度(Consistency)等方面设计了“数字风洞ISAC24”测试标准,并挑选了客户可能会“选择困难”的国内外AI模型作为横向测评对象,试图找到10万预算以内“最适合企业用户的基座模型”。
测试结果显示,尽管DeepSeek-R1展现出较大优势,但安全度方面有待加强,需要在后期的应用框架方面增加安全防护和内容过滤。
此外,永信至诚也进行了初步测算,部署DeepSeek-R1-Distill-Qwen-14B的整体解决方案市场价不超过10万元人民币,基本符合大多数企业客户的初期预算和日常需求,并且它充分开源和完全商业授权的开源策略,让更多研究人员和企业都可以基于DeepSeek-R1的训练过程进行复现和深度开发。(白丽斐)

海量资讯、精准解读,尽在新浪财经APP
VIP课程推荐
加载中...
APP专享直播
热门推荐
收起
新浪财经公众号
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
