我们对AI大模型的误解有多深?

2023年06月20日09:58    作者:胡时伟  

  意见领袖 | 新金融联盟NFA

  大模型可以无所不能吗?怎样让模型少犯错?企业应该部署多大的模型,一个超级大模型还是一堆专业模型?
  对于这些问题,第四范式联合创始人、首席架构师胡时伟认为:类GPT模型是高级复读机,有多少“人工”就有多少“智能”,绝非无所不能。模型100%会犯错,一味地追求算力和数据并不能解决这个问题,因此模型之上必须要有运营兜底机制,知错就改。算力决定参数规模,一堆专业模型比一个超级大模型更有落地可行性。
  上述观点源于6月10日新金融联盟举办的“金融机构数智化转型与大模型技术应用”内部研讨会。

  大模型并非“无所不能”

  现在各行各业都十分关注大模型这一话题。第四范式在自己的大模型产品“式说”2月份发布以来,与17个行业的114家企业进行了密集与深入的沟通,发现业界普遍对大模型存在一些误解,需要纠偏。

  第一,要相信科学。大家普遍认为大模型已经具备“涌现”能力,可以无师自通。大模型的能力主要还是源于给它提供了什么样的数据,并不是直接“涌现”出来的。本质上讲,类GPT模型的背后还是机器学习,需要高质量的数据训练而来,并通过Fine-tuning(微调)进行调优才能实现一些特定的能力。

  第二,有多少人工,就有多少智能。生成式AI到底能解决什么问题?通俗地讲,从基础大模型到行业大模型甚至到场景定制,我们目前认为它可以用以完成一份文档。在一个特定场景下正确地完成一个文档,一定来自于人反馈的数据。就像GPT要用到非常多维基百科的数据,是因为该数据质量更高。我们行业要做的是,一定要对大模型形成反馈闭环和迭代,即告诉大模型什么是好的,训练它达到更好的效果。这件事情本质还是依赖人工。

  第三,大模型生成一定会出错。哪怕是GPT-4,在行业专业、严肃场景的应用也远未达到工业可用的效果。这是技术本身的缺陷所致,靠算力和数据也无法从根本上解决这个问题。目前大部分企业的共识是模型之上必须加一层运营机制来兜底。

  企业应该部署多大的模型?

  企业在大模型落地过程中会面临一个现实问题——预算有限,预算决定了算力,算力决定了参数规模。

  因此,我们需要抉择:应该部署一个超级大模型,期待它能够把能力上升到一定程度,还是应该从解决问题出发,部署一堆专业模型,让它们各司其职。这里面涉及两个不同的思路。

  第一个思路是通过增加参数和堆砌算力,把所有参数都给NLP模型。但从实际落地的角度来看,根据No Free Lunch(没有免费的午餐)定理,没有哪一个模型能以最优的方式解决所有问题。如果我们把所有的东西都放在一个模型里最后会花出极大的代价,超级英雄成本很高,也很难管理。

  因此,我个人认为会走向另外一个方向,即Learnware(学件)的思路,我们要做一堆参数过亿的专业模型,来组成整体企业系统,这种方式更利于模型迭代、维护,同时更利于控制成本。就如同一家公司里不能都是董秘,还得有销售、产研、市场等各个专业线。

  大模型可实现传统软件两大升级

  “介质”同样是企业落地大模型的关键要素。

  想象一下,如果没有APP,推荐算法能用吗?没有搜索,广告算法能用吗?APP和搜索就是推荐算法和广告算法的介质。同样,大模型在企业落地时,企业软件就是大模型的介质如果介质没有革新,只有算法革新,就像是一个人只有脑没有手

  因此,我们非常需要关注介质层面的革新。企业中大部分工作的完成都需要使用软件,但是大量软件交互的方式都非常低效、复杂,现在我们可基于大模型解决两个升级:

  第一,由生成式大模型负责软件界面的升级人机交互要变成多模态,通过大模型更强的语义理解能力,可以更直接调用企业内部各种形式的信息、数据和模型。

  第二,由判别式大模型负责软件内核的升级。以前的软件主要围绕数据库做增删改查,现在可由判别式大模型对软件进行智能化升级。

  让大模型成为知错就改的小助手

  由于GPT在技术上存在局限性,因而无法做到百分之百准确,尤其在应用于严肃的金融场景时,大模型之上必须要加一层运营体系兜底,让模型的输出和操作从不可用变成可用,并且能做到知错就改。

  知错就改有三个机制叠加保障:一是专家给答案。虽然听起来不是那么智能,但在专家能给答案的地方一定要给答案,因为这个是最准确的。二是专家给示例,模型进行一定的上下文学习也可以表现更好。三是模型自主学习,基于专家生成的知识反馈给模型,让模型少犯错。

  生成式大模型加上“执行可控、知错能改”的运营体系,我们可以期待有一位善于理解、准确执行的工作助手。这位助手需要让用户可以清晰了解哪些内容是“100%准确”,哪些是“不确定的”,并且知错能改。

  总体来说,底层大模型不能解决所有问题,介质层及运营机制的革新对于数字化推动作用同样重要。企业需重新打造决策类AI、生成式AI、应用层、介质层。我们目前探索落地的重点是让生成式大模型结合介质,围绕企业数字化转型的目标,在企业里生成一堆Agent,分别用以查资料、查数据、准确操作软件等,这可能是当下一个更加贴合实际、可落地的方向。

  (本文作者介绍:一个高质量的新金融政策研讨和行业交流平台。)

责任编辑:张文

  新浪财经意见领袖专栏文章均为作者个人观点,不代表新浪财经的立场和观点。

  欢迎关注官方微信“意见领袖”,阅读更多精彩文章。点击微信界面右上角的+号,选择“添加朋友”,输入意见领袖的微信号“kopleader”即可,也可以扫描下方二维码添加关注。意见领袖将为您提供财经专业领域的专业分析。

意见领袖官方微信
分享到:
保存  |  打印  |  关闭
快讯:百度短线下挫跌超7% 文心一言正式发布 315晚会曝光假香米、非标水泥管等,多地连夜处置涉事企业 一图读懂丨“315晚会”都曝光了什么?点名了哪些企业? 刚刚!林毅,被查!2000亿白马跳水!上海突发!警方出手:刑拘! 女学员单飞歼11B向家人报喜笑得真甜 河南某县美术馆馆长群聊发不雅照 解释称手机中病毒 补壹刀:今天最大的国际笑话,但可能是一盘大棋! 视频|红色通缉犯郭文贵在美国被捕 奇葩的创维汽车:碰撞试验0分,专攻司机养生,创始人豪言“开车可续命” | 次世代车研所 “反华五人帮”曝光