OpenAI的o1模型推理时蹦出中文 专家猜:AI可能只想用最高效的语言来思考

OpenAI的o1模型推理时蹦出中文 专家猜:AI可能只想用最高效的语言来思考
2025年01月15日 01:08 市场资讯

  来源:华尔街见闻

  o1模型为何在推理时使用中文或其他语言来思考尚不得而知,但有专家猜测,原因可能是模型在训练时使用了中文或其他语言的数据标注,也有可能是模型倾向于自行选择它们认为最能有效实现其目标的语言,或者出现了幻觉。

  媒体报道,在OpenAI 发布其首个“推理”AI模型o1不久后,有用户注意到一种奇怪的现象:即使用户是用英语提问,这一模型有时会在回答问题时突然“转而用”中文、波斯语或其他语言“思考”。

  例如,当被问及“单词‘strawberry’中有多少个‘R’?”时,o1会开始其“推理”过程,通过一系列推理步骤得出答案。如果问题是用英语写的o1的最终回答会是英语,但在得出结论之前,它可能会在某些步骤中使用其他语言。

  一位Reddit用户表示,“o1在中途随机地开始用中文思考。” 另一位用户在X发文询问:“为什么o1会随机开始用中文思考?整段对话(超过5条信息)都没有使用中文。”

  OpenAI尚未对o1的这种奇怪行为作出解释,也没有正式承认这一现象。AI专家对此也没有明确答案,但他们提出了一些猜测。

  使用中文数据标注引起?

  包括 Hugging Face 的首席执行官 Clément Delangue等人表示,像o1这样的推理模型接受了大量包含中文字符的数据训练。谷歌DeepMind的研究员Ted Xiao声称,包括OpenAI在内的一些公司使用中国的第三方数据标注服务,而o1转向中文可能是“推理过程中受到中文语言影响”的一个例子。

  Ted Xiao在X上写道:

“OpenAI和Anthropic等实验室利用[第三方]数据标注服务,为科学、数学和编程领域的高水平推理数据提供支持,而许多数据提供商都位于中国。”

  在AI训练领域,标注(Labels,也称为标签或注解)在训练过程中帮助模型理解和解释数据。例如,用于训练图像识别模型的标注可能包括为对象周围添加标记,或为图像中的每个人、地点或物体提供描述。

  研究表明,带有偏见的标注可能会导致带有偏见的模型。例如,普通标注员更可能将非标准英语(如美国黑人英语,AAVE)标记为“不健康”(toxic)语言,这导致基于这些标注训练的AI毒性检测器更倾向于认为AAVE 是“不健康”的。

  不过,也有一些专家并不认同“中文数据标注”的猜测。他们指出,o1同样可能在解决问题时切换到印地语、泰语或其他语言。

  AI只想使用最高效的语言来思考?

  另一种观点认为,o1和其他推理模型可能只是使用了它们认为最能有效实现其目标的语言(或出现了幻觉)

  阿尔伯塔大学的助理教授、AI 研究员Matthew Guzdial在接受TechCrunch采访时说,“模型并不知道语言是什么,也不知道语言之间有区别。对它来说,这些只是文本而已。”

  实际上,模型并不直接处理单词,而是处理“标记”(tokens)。标记可以是单词(例如“fantastic”),也可以是音节(例如“fan”、“tas”和“tic”),甚至是单词中的单个字符(例如“f”、“a”、“n”、“t”、“a”、“s”、“t”、“i”、“c”)。

  像标注一样,标记也可能引入偏见。例如,许多从单词到标记的转换器假设句子中的空格表示一个新单词的开始,而实际上并非所有语言都使用空格来分隔单词。

  Hugging Face的软件工程师Tiezhen Wang赞同这一观点,认为推理模型的语言不一致性可能源于模型在训练期间与特定语言建立的某些关联。

“通过接纳每一种语言的细微差别,我们扩展了模型的世界观,使模型能够全面学习人类知识。例如,我喜欢用中文做数学,因为每个数字只有一个音节,这让计算更简洁高效。但在讨论诸如‘无意识偏见’之类的话题时,我会自动切换到英语,因为我最初就是通过英语学习和吸收这些概念的。”

  AI模型是概率机器,通过大量示例的训练学习模式,并据此作出预测。然而,非盈利组织艾伦人工智能研究所的研究科学家Luca Soldaini警告说,“我们无法确定模型内部的运行逻辑。对已经部署的AI系统进行这类观察,由于其高度不透明性,是无法支持任何结论的。这也说明了为什么在构建AI系统时保持透明性至关重要。”

  风险提示及免责条款

  市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

海量资讯、精准解读,尽在新浪财经APP

责任编辑:丁文武

9条评论|23人参与网友评论
最热评论
噢耶哈啦_海南儋州
可以用这么多语言,也是很厉害的样子,不错了
1月15日23:22举报5回复
这么多语言可以用。看着很不错的样子哦[doge][doge]
1月15日23:28举报2回复
卑微路过人福建宁德
如果能享用最高效的语言来思考,还是挺有必要的
1月15日23:27举报2回复
最新评论
Ai技术真是发展的越来越全面了,也用的越来越广泛
1月15日23:37举报回复
为你而放心甘肃平凉
看的出来现在的AI技术发展的越来越好了
1月15日23:37举报回复
奢忸四川达州
了解到了更多,AI技术也是发展得越来越好了,来感受
1月15日23:29举报回复

APP专享直播

开播时间 | 2-17 09:00
华夏基金:解盘一刻
开播时间 | 2-17 09:00
光大证券雪姐:阳光早参-利好来袭!尾盘拉升!反弹重启?
开播时间 | 2-16 19:00
华安基金:ETF会客室:DeepSeek引领科技行情,后市如何投资?
开播时间 | 2-16 19:00
景顺长城基金:汇一代「综狮」 铸科技中国
开播时间 | 2-16 14:00
中国全固态电池创新发展高峰论坛:人工智能赋能全固态电池研发平台升级
开播时间 | 2-16 14:00
2025复旦大学管理学院新年论坛
开播时间 | 2-16 13:44
为您·预见—宁波银行开年投策会
开播时间 | 2-16 08:00
中国全固态电池创新发展高峰论坛:材料创新趋势与先进技术
开播时间 | 2-15 17:00
中国全固态电池创新发展高峰论坛:欧阳明高、孙世刚、王德平、孙华军等演讲
开播时间 | 2-14 20:00
「2025蛇年投资大趋势 」对话东方港湾但斌:拥抱时代 与优秀企业共成长
开播时间 | 2-17 09:00
华夏基金:解盘一刻
开播时间 | 2-17 09:00
光大证券雪姐:阳光早参-利好来袭!尾盘拉升!反弹重启?
开播时间 | 2-16 19:00
华安基金:ETF会客室:DeepSeek引领科技行情,后市如何投资?
开播时间 | 2-16 19:00
景顺长城基金:汇一代「综狮」 铸科技中国
开播时间 | 2-16 14:00
中国全固态电池创新发展高峰论坛:人工智能赋能全固态电池研发平台升级
开播时间 | 2-16 14:00
2025复旦大学管理学院新年论坛
开播时间 | 2-16 13:44
为您·预见—宁波银行开年投策会
开播时间 | 2-16 08:00
中国全固态电池创新发展高峰论坛:材料创新趋势与先进技术
开播时间 | 2-15 17:00
中国全固态电池创新发展高峰论坛:欧阳明高、孙世刚、王德平、孙华军等演讲
开播时间 | 2-14 20:00
「2025蛇年投资大趋势 」对话东方港湾但斌:拥抱时代 与优秀企业共成长
上一页下一页
1/10

热门推荐

61岁乘客在飞机上昏迷抢救无效死亡 航司回应 收起
61岁乘客在飞机上昏迷抢救无效死亡 航司回应

61岁乘客在飞机上昏迷抢救无效死亡 航司回应

  • 2025年02月16日
  • 14:00
  • APP专享
  • 扒圈小记
  • 43,514
APP专享
法国小伙带622张日军侵华照片抵达北京,希望捐赠给中国

法国小伙带622张日军侵华照片抵达北京,希望捐赠给中国

  • 2025年02月16日
  • 13:38
  • APP专享
  • 扒圈小记
  • 19,851
APP专享
影院支持《哪吒2》暂不排片《美队4》,回应:放映厅少,优先支持国漫

影院支持《哪吒2》暂不排片《美队4》,回应:放映厅少,优先支持国漫

  • 2025年02月16日
  • 11:25
  • APP专享
  • 北京时间
  • 5,385
APP专享
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间
更多>
股票简称 最新价 涨跌幅
以下为热门股票
三峡能源 4.26 0.00%
京东方A 4.62 +0.87%
TCL科技 4.99 +0.40%
中远海控 14.70 +0.48%
格力电器 43.44 -1.25%

7X24小时

  • 01-16 亚联机械 001395 19.08
  • 01-16 海博思创 688411 19.38
  • 01-14 富岭股份 001356 5.3
  • 01-13 兴福电子 688545 11.68
  • 01-13 超研股份 301602 6.7
  • 新浪首页 语音播报 相关新闻 返回顶部
    关闭
    关闭