转自:财联社
财联社1月15日讯(编辑 夏军雄)据媒体报道,在人工智能(AI)研究公司OpenAI 发布其首个推理AI模型o1不久后,人们发现了一个奇特的现象,即使在用英文提问的情况下,o1有时会中途使用中文、波斯语或其他语言进行推理。
例如,当被问到“Strawberry”(草莓)这个单词里有几个字母“r”时,o1会通过一系列推理步骤得出答案。如果问题是用英文写的,o1的最终回答通常也会是英文,但在推理过程中,它可能会用另一种语言处理部分步骤,然后得出结论。
一些人在网络社区讨论了这一现象。“(o1)推理到一半时突然开始用中文‘思考’了,”一位 Reddit用户写道。
另一位X平台上的用户发帖询问:“为什么(o1)会突然用中文思考?整段对话(超过5条消息)里完全没有涉及中文。”
OpenAI尚未对o1的这种怪异行为作出解释,也没有承认这一现象的存在。AI专家对此也没有确切答案,但提出了一些理论。
AI 专家众说纷纭
在X平台上,包括AI初创公司Hugging Face首席执行官Clément Delangue在内的多人提到,像o1这样的推理模型是用包含大量中文字符的数据集训练的。
谷歌DeepMind的研究员Ted Xiao指出,包括OpenAI在内的公司使用了来自中国的第三方数据标注服务,而o1切换到中文可能是“中文语言对推理的影响”的一个例子。
标注在模型训练过程中帮助模型理解和解释数据。例如,训练图像识别模型的标注可能包括围绕物体的标记或描述图像中每个人、地点或物体的文字说明。
然而,其他专家并不认同关于“o1使用中文数据标注”的猜测。他们指出,o1在推理过程中同样可能切换到印地语、泰语或其他非中文的语言。
这些专家认为,o1和其他推理模型可能只是选择了它们认为最有效的语言来完成任务,或者是出现了“幻觉”。
“模型并不知道语言是什么,也不知道语言之间的区别,”阿尔伯塔大学的 AI 研究员兼助理教授Matthew Guzdial表示。“对它来说,一切都只是文本。”
Hugging Face软件工程师Tiezhen Wang同意Guzdial的观点,他认为,推理模型的语言不一致性可能源于模型在训练期间与特定语言建立的某些关联。
“通过接纳每一种语言的细微差别,我们扩展了模型的世界观,让它从全方位的人类知识中学习,”Wang在X上写道。“比如,我喜欢用中文做数学计算,因为每个数字都只有一个音节,这让计算变得简洁高效。但在涉及无意识偏见这样的话题时,我会自动切换到英语,主要因为这些概念是我最初用英语学习和吸收的。”
非营利组织艾伦人工智能研究所的研究科学家Luca Soldaini则指出,目前无法确定造成这一现象的真正原因。
“由于这些模型非常不透明,对已部署的AI系统的这种观察是无法证实的。这正是为什么AI系统开发过程中的透明性至关重要的原因之一,”Soldaini表示。
(财联社 夏军雄)
VIP课程推荐
APP专享直播
热门推荐
TikTok通知美国用户将暂停服务 收起TikTok通知美国用户将暂停服务
- 2025年01月19日
- 02:36
- APP专享
- 广西台新闻910
- 31,136
《射雕英雄传》超过《唐探3》,成为影史预售最快破千万电影
- 2025年01月19日
- 01:58
- APP专享
- 我是山河君
- 6,066
串手串赚代加工费?“宝妈”钱没赚到货款也没了,警方已立案
- 2025年01月19日
- 02:31
- APP专享
- 我是山河君
- 4,205
24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
东方红陈晨今天 00:33:41
【OpenAI将于几周内推出o3 mini推理AI模型】财联社1月18日电,OpenAI首席执行官Sam Altman当地时间1月17日在社交媒体平台X上的一篇文章中表示,已完成新推理AI模型o3 mini版本,并将在几周内推出。 -
徐善武今天 00:30:18
证券市场再次传来两大重磅利好,1,一行一会周末加班再次联合召开股票回购增持再贷款座谈会,进一步发挥政策工具稳定资本市场作用,鼓励金融机构加大股票回购再贷款力度,2025年股票回购增持再贷款政策进一步优化,放宽了门槛,减轻了借款人压力,这有利于上市公司加大股票回购,维护市场稳定2,最高层印发《教育强国建设规划纲要,(2024-2035年)》,教育和创新人才未来是强国建设中的重要战略目标,教育强,则人才兴,人才兴,则国强,教育概念将会成为明日的热点,预计要起飞了明日的A股市场看点十足,周末利好消息满天飞,A股高开是确定了,很多人担心会高开低走,A股预计会高开高走,预计中阳线收盘 -
量化伏妖今天 00:28:02
2025年1月20日大家早上好!技术上粘合线日线金叉两日后上行减缓,价值陡峭日线拐头下行,指数重新回到日线(3240)和周线(3178)市场内在价值线之上,预示着大盘重新回到振荡上升趋势,成交量是去年9月以来地量。大洋彼岸喜庆是人家的事,长期敌对是本质,关系缓和利好的有限。接近春节能有一波小的春节红包行情就已经是最大的人情安慰了,不敢有过多奢望。 -
徐善武今天 00:27:59
【投资日历:周一资本市场大事提醒】①今日暂无股申购。②国新办1月20日举行系列新闻发布会,介绍“夯实‘三农’基本盘,扎实推进乡村全面振兴”有关情况。③上交所和中证指数有限公司将于1月20日正式发布上证科创板综合指数(sh000680)及其价格指数。④大商所:胶合板2509、2511、2601合约将于1月20日起上市交易。⑤特朗普将于1月20日宣誓就职美国总统,预计宣布100多项行政命令,涉及边境安全、移民执法措施和能源开发等优先事项。⑥市场监管总局印发《网络交易执法协查暂行办法》,将于1月20日起施行。⑦恒生沪深港汽车主题指数编算方法变更,相关的成份股变动将于1月20日(星期一)生效。⑧辽宁省第十四届人民代表大会第三次会议于1月20日在沈阳召开。⑨广州燃气价格将于1月20日起下调。⑩2025年世界经济论坛年会将于1月20日至24日在瑞士达沃斯克-洛斯特斯举行。商务部:1月20日起实施手机等数码产品购新补贴。因假期,美股休市一日。今日有248亿元7天期逆回购到期。今日将公布中国1月一年期、五年期LPR等数据。 -
东方红陈晨今天 00:27:17
【南山铝业(sh600219):2024年度预计扣非净利润46.15亿元-50.23亿元 同比增长70%-85%】财联社1月19日电,南山铝业(sh600219)公告称,预计2024年度实现归属于母公司所有者的净利润为45.16亿元到48.64亿元,同比增长30%到40%。预计实现归属于母公司所有者的扣除非经常性损益的净利润为46.15亿元到50.23亿元,同比增长70%到85%。业绩增长的主要原因是印尼200万吨氧化铝项目产能全部释放,产量增加,以及铝锭及氧化铝粉价格上涨,公司凭借成本控制和抗风险优势,业务发展态势良好。具体准确的财务数据以公司正式披露的经审计后的2024年度报告为准。 -
徐善武今天 00:25:07
新的一天,新的战斗,欢迎大家来到本直播室!新进的朋友请点击上方【关注】按钮,第一时间接收盘面分析消息,谢谢大家的支持! -
徐善武今天 00:24:58
本人从业20年,湖北卫视《天生我财》栏目长期特邀嘉宾,《四维博弈》投资体系创始人。投资风格以价值投资为导向,充分通过基本面分析筛选出优质标的,投资风格稳健为主,长期主义的践行者。《四维博弈》产品运行近6年,平均年化收益在20%以上【更多独家重磅股市观点请点击】 -
东方红陈晨今天 00:23:56
【中共中央、国务院印发《教育强国建设规划纲要(2024—2035年)》】财联社1月19日电,中共中央、国务院印发了《教育强国建设规划纲要(2024—2035年)》,面向到2035年建成教育强国目标,对加快建设教育强国作出全面系统部署。纲要是首个以教育强国为主题、以全面服务中国式现代化建设为重要任务的国家行动计划,是全面推进教育科技人才一体统筹发展、提升国家创新体系整体效能的顶层制度安排。纲要明确了到2027年和2035年的主要目标,部署了9个方面重点任务:塑造立德树人新格局,培养担当民族复兴大任的时代新人;办强办优基础教育,夯实全面提升国民素质战略基点;增强高等教育综合实力,打造战略引领力量;培育壮大国家战略科技力量,有力支撑高水平科技自立自强;加快建设现代职业教育体系,培养大国工匠、能工巧匠、高技能人才;建设学习型社会,以教育数字化开辟发展新赛道、塑造发展新优势;建设高素质专业化教师队伍,筑牢教育强国根基;深化教育综合改革,激发教育发展活力;完善教育对外开放战略策略,建设具有全球影响力的重要教育中心。 -
东方红陈晨今天 00:23:27
【中共中央、国务院:推广普及国家通用语言文字 开展语言国情国力调查】财联社1月19日电,中共中央、国务院印发《教育强国建设规划纲要(2024—2035年)》。推广普及国家通用语言文字。实施国家通用语言文字普及攻坚和质量提升行动。提高全民语言文化素养。健全语言文字规范标准体系,建设新型国家语料库。开展语言国情国力调查。加强网络空间语言文字规范引导。深入实施国家语言文化传承发展系列工程。加强与港澳台语言文化交流。 -
数字江恩今天 00:22:59
上周五最高点3256,并未新高3140反弹最高的3265。而上周五收盘后,富时A50略有异动,纳斯达克中国金龙指数也收中阳。3140的反弹仍未结束,最多中途有所震荡,今日早盘还可以有所冲高,依旧看3256/3286压力,冲高后也要回落震荡。