人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。
英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。
主因是数据模糊
各种生成式AI,包括由大语言模型驱动的聊天机器人(19.290, 0.00, 0.00%),常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。
美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。
美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。
导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。
多领域面临考验
AI的“幻觉”可能会给人们的工作和生活带来较大影响。
在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。
在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。
《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。
多举措减少“幻觉”
为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。
例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。
此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。
检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。
不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。
开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。
在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。
美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。(记者 刘 霞)
原标题:生成式AI“幻觉”困境如何破解 来源:科技日报
APP专享直播
热门推荐
吕国泉委员:建议每周上班不超44小时 收起吕国泉委员:建议每周上班不超44小时
- 2025年03月04日
- 11:32
- APP专享
- 扒圈小记
16,511
在白宫质疑泽连斯基着装,美国记者称遭死亡威胁
- 2025年03月04日
- 08:18
- APP专享
- 扒圈小记
10,676
鸿蒙智行称遭某公司操纵上万账号诋毁 该公司多人已被公安机关缉拿归案并被检察院依法批准逮捕
- 2025年03月04日
- 09:55
- APP专享
- 北京时间
7,959

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
冯矿伟今天 00:59:51
最新博文:《冯矿伟:周三操作策略》【更多独家重磅股市观点请点击】 -
宋谈股经今天 00:50:22
3.05早盘:涨多少,你才能回本呢?:【更多独家重磅股市观点请点击】 -
宋谈股经今天 00:45:38
全国人大会议议程.十四届全国人大三次会议将于3月5日上午9时开幕,3月11日下午闭幕,会期7天,共安排3次全体会议。大会主要议程包括审议政府工作报告、审查2025年国民经济和社会发展计划草案及2025年中央和地方预算草案等。会议期间将举行三场记者会,请国务院有关部门主要负责同志分别就外交、经济、民生等主题回答记者的提问。每次全体会议前,将安排“代表通道”,全体会议后将安排“部长通道”。(来源:wind)解读对A股影响:会议期间将审议政府工作报告等重要议程,为A股市场提供政策导向,可能影响相关板块走势。记者会将透露外交、经济、民生等关键信息,市场参与者将据此调整投资策略。“代表通道”和“部长通道”的发言可能释放行业利好信号,提振相关板块信心。 -
趋势领涨今天 00:43:15
重大公告:盘江股份(sh600395)66.7亿元投建贵州能源普定电厂项目;嘉必优(sh688089)拟8.31亿元收购欧易生物63.2134%股权;晶华新材(sh603683)拟3亿元投建电子级高端胶粘新材料生产及研发中心项目;米奥会展(sz300795)拟1.01亿元参与基金投资;航天电器(sz002025)拟5693万元收购江苏奥雷32.7%股权;顶点软件(sh603383)拟3149万元转让上海倍发20%股权; -
宋谈股经今天 00:42:41
大家好,华源证券投资顾问宋俊,欢迎大家关注!华源证券资深投顾,华源证券“源投顾”第一期投顾大咖争锋赛“状元"和金牌投顾训练营“优秀学员"。十年磨一剑,历经牛熊,独创趋势为王+资金推动论,精准判断市场机会与风险,以及个股买卖点把握。擅长涨停复制,中线主力,翻倍牛股等多种战法。基本面+技术面结合,稳健操作,实现在股市长期生存。 -
趋势领涨今天 00:42:05
个股利空:惠发食品(sh603536)年报预亏;江南奕帆(sz301023)、曲美家居(sh603818)、文科股份(sz002775)股东拟减持。 -
趋势领涨今天 00:40:07
个股利好:海南华铁(sh603300)签署36.9亿元5年期算力服务协议;宏润建设(sz002062)中标2.48亿元储能项目;宜通世纪(sz300310)中标2.28亿元中国移动(sh600941)集中采购项目;司南导航(sh688592)签订1.45亿元合同;博实股份(sz002698)签订8846万元设备销售合同;ST浩源(sz002700)申请摘帽;海泰新光(sh688677)、联创光电(sh600363)拟回购;芯能科技(sh603105)、禾迈股份(sh688032)股东拟增持。 -
徐善武今天 00:29:09
【投资日历:周三资本市场大事提醒】①今日暂无新股申购。②十四届全国人大三次会议将于3月5日上午在北京开幕,11日下午闭幕,会期7天。③国新办3月5日上午11时30分举行吹风会,解读《政府工作报告》。④坦桑尼亚将于3月5日启动26个石油和天然气区块的勘探许可招标。⑤华为终端官微:华为Mate70 Pro优享版,将于3月5日10:08正式开售。⑥国内成品油将开启新一轮调价窗口。⑦今日海天股份(sh603759)将披露年报。⑧今日有5487亿元7天期逆回购到期。⑨今日将公布美国2月ADP就业人数等数据。 -
徐善武今天 00:27:13
新的一天,新的战斗,欢迎大家来到本直播室!新进的朋友请点击上方【关注】按钮,第一时间接收盘面分析消息,谢谢大家的支持! -
徐善武今天 00:27:05
本人从业20年,湖北卫视《天生我财》栏目长期特邀嘉宾,《四维博弈》投资体系创始人。投资风格以价值投资为导向,充分通过基本面分析筛选出优质标的,投资风格稳健为主,长期主义的践行者。《四维博弈》产品运行近6年,平均年化收益在20%以上【更多独家重磅股市观点请点击】