科学家用Oogiri游戏提高大模型创造力,能自动生成幽默段子和编写剧本

科学家用Oogiri游戏提高大模型创造力,能自动生成幽默段子和编写剧本
2024年07月05日 18:19 DeepTech深科技

来源:DeepTech深科技

当前,尽管思维链(CoT,Chain-of-Thought)极大提升了大模型的逻辑推理能力,并让大模型能够逐步推导解决方案。

但是,这种链式思维模式采取一步一步思考的方式,在面对需要创造性思维的问题时会显得力不从心。

在探索如何解决这一难题时,中山大学教授林倞团队联想到人类解决问题时常有的“灵光一闪”(LoT,Leap-of-Thought)现象,于是尝试从创造性思维着手,来提升大模型的创造力。

图  | 左起:林倞、黄中展、钟珊珊(来源:课题组)图  | 左起:林倞、黄中展、钟珊珊(来源:课题组)

基于此,在近期一项课题之中,他们研究了大模型的 LoT 能力,探索了提升大模型创造力的新方法。

尤其探索了大模型的跳跃性联想能力和非传统推理思路能力,即如何让大模型超越逻辑链,实现更加灵活、更加创新的思考,以适应那些需要跳出常规思维框架的任务。

图 | 两种不同的思维示意图(来源:CVPR)图 | 两种不同的思维示意图(来源:CVPR)

机缘巧合之下,该团队发现了 Oogiri 游戏这一平台。Oogiri 游戏起源于日本,通过提供各种多模态内容,能够提示玩家想出幽默的、有创意的反应,以达到令人惊讶的喜剧效果。

图 | Oogiri 游戏样例(来源:CVPR)图 | Oogiri 游戏样例(来源:CVPR)

基于 Oogiri 的数据,他们也想探索如何让大模型生成幽默观点、进行跨领域联想、以及在没有直接线索的情况下提出新颖观点。

即如何通过使用 Oogiri 这种传统幽默喜剧游戏,来搭建提高大模型创新能力的平台。

在收集 Oogiri 数据的过程中,他们发现 Oogiri 数据来源不统一、而且格式多样。

于是,该团队综合使用光学字符识别、图片裁剪等方法,针对数据进行人工清洗和人工筛查。

借此将 Oogiri 数据整理成统一的问答格式,从而构建出多模态、多语言的 Oogiri-GO 数据集,并基于此来探索大模型的创造力。

但是,“灵光一闪”这件事情很难得到量化。因此,如何解决大模型创造力量化的问题,成为他们验证本次方法的关键。

后来,课题组基于 Oogiri-GO 设计了选择题和排序题,并以此作为评估数据,让大模型可以像做卷子那样完成评测。

图 | 本次方法生成的样例(来源:CVPR)图 | 本次方法生成的样例(来源:CVPR)

总的来说,本次成果可以帮助人们开发更加智能、更加有趣的互动娱乐内容,比如自动生成幽默段子、编写创意剧本等。

当然,本次方法并不仅仅局限于幽默生成,还能用于研究大模型的创新思考能力。

课题组表示:“Oogiri 只是我们的研究平台,而我们的研究核心在于提升大模型的创造力

他们希望 LoT 思维模式能让大模型像人类一样具备跳跃式思考的能力。

下一步,他们计划继续针对大模型创造力开展研究,探索更多可以激发和衡量创造性思维的场景和任务。

并打算将本次框架应用于更广泛的领域,比如用于艺术创作和科学假设生成等,以便进一步拓展 AI 的能力。

同时,他们也将努力让大模型的创造性输出变得更加可控、更加人性化,以确保该技术是安全且负责任的。

参考资料:

1.https://arxiv.org/pdf/2312.02439

运营/排版:何晨龙

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片