科学家研发细粒度检测框架,能识别长文本中的AI内容,填补文本检测的空白

科学家研发细粒度检测框架,能识别长文本中的AI内容,填补文本检测的空白
2024年08月27日 15:29 DeepTech深科技

来源:DeepTech深科技

日前,相关论文以《探测 AI 痕迹: 分辨文本中的 AI 改写片段》(Spotting AI’s Touch: Identifying LLM-Paraphrased Spans in Text)为题发表在国际计算语言学年会 ACL 2024 Findings(Findings of the Annual Meeting of the Association for Computational Linguistics)[2]。

图 | 论文作者之一:李雅夫(来源:李雅夫)图 | 论文作者之一:李雅夫(来源:李雅夫)

不同于传统的文本级别检测方法,PTD 能够在一段长文本中识别出具体的 AI 改写片段,并为每一句话分配一个改写程度的分数。

这种细粒度的检测是以往研究中所没有的,故能提供更精准的检测结果和更详细的文本分析。

通过构建一个专门的数据集 PASTED(paraphrased text span detection dataset),课题组验证了 PTD 模型在识别 AI 改写文本片段方面的有效性。

实验结果显示:PTD 模型不仅在检测效果上表现优异,还能够推广到不同领域和未见过的模型生成的文本。

这说明 PTD 具有很强的适应性和实用性,能够应对多种复杂的文本生成和改写场景。

(来源:ACL 2024 Findings)(来源:ACL 2024 Findings

据介绍,PTD 能够识别部分由 AI 润色和改写的文本片段,提供细粒度的检测结果,从而为决策提供更全面、细致的数据支撑。

相比而言,传统的 AI 文本检测方法只能为整段文本打一个标签,而 PTD 则能够精确识别具体哪些段落被 AI 改动过,使决策更有说服力。

因此,预计 PTD 将在以下几个领域展现其应用价值:

在教育领域,它能防止学术抄袭;

在新闻和媒体领域,它能帮助识别假新闻和防止虚假信息传播;

在法律领域,它能保障证据的可靠性;

在商业和营销领域,它能优化广告文案的真实性和一致性;

在社交媒体领域,它能进行内容审核和用户行为分析,整体提升信息的真实性和可靠性。

总之,本次研究通过提出细粒度的改写文本片段检测框架,旨在解决现有检测方法的不足,探索更加精准和可靠的 AI 文本生成检测方法。

未来,他们将进一步优化 PTD 模型,以提高其在复杂文本生成和改写场景中的检测精度和泛化能力。

同时,他们计划扩展 PTD 数据集,涵盖更多领域和文本类型,以增强模型的适应性。

最后,他们打算开放一个免费的检测平台,并接受用户反馈,在此基础上不断迭代优化模型,提升其检测能力和鲁棒性,为可信 AI 贡献一份力量。

参考资料:

1.Yafu Li, Zhilin Wang, Leyang Cui, Wei Bi, Shuming Shi, and Yue Zhang. 2024. Spotting AI’s Touch: Identifying LLM-Paraphrased Spans in Text. In Findings of the Association for Computational Linguistics ACL 2024, pages 7088–7107, Bangkok, Thailand and virtual meeting. Association for Computational Linguistics.

2.Yafu Li, Qintong Li, Leyang Cui, Wei Bi, Zhilin Wang, Longyue Wang, Linyi Yang, Shuming Shi, and Yue Zhang. 2024. MAGE: Machine-generated Text Detection in the Wild. In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), pages 36–53, Bangkok, Thailand. Association for Computational Linguistics.

运营/排版:何晨龙

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片