OpenAI员工公开指责Grok3的基准测试结果具有误导性

OpenAI员工公开指责Grok3的基准测试结果具有误导性
2025年02月23日 09:48 港股那点事

格隆汇2月23日|近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

海量资讯、精准解读,尽在新浪财经APP
基准

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 03-04 弘景光电 301479 --
  • 02-28 汉朔科技 301275 --
  • 02-28 永杰新材 603271 --
  • 02-21 汇通控股 603409 24.18
  • 02-20 毓恬冠佳 301173 28.33
  • 新浪首页 语音播报 相关新闻 返回顶部