360组“联盟”与GPT-4 互争雄长,胜算几何?

360组“联盟”与GPT-4 互争雄长,胜算几何?
2024年08月08日 14:47 市场资讯

作者:邸睿芳

编辑:张丽敏

制图:张宇萱

“如果把GPT-4比喻成灭霸,我们要组成一个‘复仇者联盟’。”8月4日,360集团创始人周鸿祎在社交媒体平台上透露:“公司近期整了个大活儿,打算通过联盟的力量超越GPT-4。”

周鸿祎显然是个明白人,知道单靠一家大模型厂商是没法和GPT-4掰手腕的。于是,经过分析,周鸿祎表示,能不能让国内大模型团结在一起,通过360集团发明的COE架构,即Collaboration-of-Experts(专家协同模型),把16家大模型逻辑上合成一个虚拟的大模型,每个大模型发挥各自的优势,集合大家的优点实现对GPT-4的全面超越。

很快,这个由16家大模型组成的AI搜索应用“360 AI助手”就上线了。然而,任何新生事物都免不了面临质疑。毕竟,要把16家大模型在逻辑上合为一体,这在技术上、利益分配上等都是一道道难题。更不用说,一些用户在试用后忍不住吐槽:“‘360 AI助手’的回答简直让人抓狂,还不如用我常用的语言类大模型呢。”

看来,要想实现这个项目的成功和可持续发展,还要克服重重挑战,这才能真正打造出一个强大的“复仇者联盟”,与“灭霸”一较高下。

01  集中力量办大事?

周鸿祎在题为“中国16家大模型组建‘复仇者联盟’ 超越美国GPT”的视频中,亮出了合作的“三板斧”。

首先,他强调了打造COE架构的重要性,该设计相当于通过技术工作流把国内大模型连在一起。当用户输入要求时,360将捕捉用户意图,并判断用户所需大模型的类型,随后调度相应领域内表现最好的一个或多个国内大模型协同作业。

盘古智库高级研究员江瀚在接受中国经济时报·中时财经采访时,对COE架构进行了剖析,认为该设计技术可行性存在,但这种尝试极具挑战性。

“首先,COE需要解决的关键技术难题有很多,比如,模型间接口的统一与标准化、数据共享与隐私保护、模型间决策冲突的解决机制等,以及如何在逻辑上无缝集成各模型的输出以形成一致的响应。其次,技术难题还体现在模型的兼容性和互操作性上,确保不同厂商开发的模型能够顺利接入并协同工作。此外,如何评估并优化合成模型的性能,确保其优于单独模型的总和,也是一个复杂的问题。”江瀚如是指出。

接着,周鸿祎介绍了“第二板斧”——定位各模型专长。针对传统测试方法的局限性,360做了一个AI搜索,其有海量真实用户数据,细分出4000多个类别,对国内大模型进行了全面评估,从而获得了各模型能力特长的画像。这一举措不仅为各大模型量身定制了能力标签,更为后续的调度打下了基础。

至于“第三板斧”——如何说服多家来合作,周鸿祎表示,国内大模型企业越来越意识到人工智能成为国家发展的重要引擎,也意识到合作的重要性。在“携手合作,超越美国GPT”的共同愿景下,360的倡议得到了广泛响应,昔日的竞争对手如今也携手并肩迈向新征程。

据360集团相关负责人向中国经济时报·中时财经提供的资料来看,除去360其他15家国内大模型分别为智谱、商汤、百川智能、火山引擎、百度智能云、腾讯混元、讯飞星火、华为、MiniMax、零一万物、面壁智能、Deepseek、学而思、九章大模型、Kimi。

萨摩耶云科技集团首席经济学家郑磊在接受中国经济时报·中时财经采访时对于这种合作模式给予了正面评价,认为它能够发挥各大模型的优势,属于大模型领域的一种新的商业模式。

在这种新商业模式下,考虑到参与合作的各家的不同商业目标和利益诉求,构建一个公平高效的合作机制或许尤为关键。

郑磊分析道,从理论上讲,国内大模型厂商根植于不同行业,其训练数据各具特色,因此大模型也会表现出某些方面更强的特点。如果能够通过一种合理的利益分配模式把它们结合在一起,应该可以超过单一的大模型。

不过,郑磊提醒道,目前分类可能过细了,虽然各有所长,但共性还是主要的,因此在分配任务方面恐怕难以做到公平合理,这将影响到各家厂商在收益方面的分配。此外,这种联盟本身也会出现法律灰色地带,如服务定价,可能会涉及到垄断。

尽管如此,鉴于目前大模型行业赢利较困难,商业模式还不够成熟,郑磊鼓励各方以开放的心态参与这一尝试,共同探索合作的可能性。

02 体验分化,如何实现超越?

当前,360已将“360安全卫士桌面”与“360浏览器”打造为通往“360 AI助手”的便捷门户,吸引了不少用户纷至沓来。然而,用户使用后的反馈却不尽相同。

小忆作为“360 AI助手”的首批尝鲜者之一,在某社交平台上表示:“这种一站式服务太赞了,能让我一次性体验国内众多主流大模型。更绝的是,面对同一问题,我可以切换不同大模型的视角,还能对比答案,给这种人性化的设计点赞!”

然而,并非所有用户都沉浸在喜悦之中。阳阳在接受中国经济时报·中时财经采访时表达了对使用体验的不满。她提及,当要求“360 AI助手”进行自我介绍时,却只收获了撰写自我介绍的技巧指南,而非它的个人介绍。即便重复指令,也只换来了一篇虚构的跳槽经历,令人啼笑皆非。

还有悦悦,一位从事文秘工作的人士,对于“360 AI助手”的文本处理能力同样向中国经济时报·中时财经表达了不满:“输入字符的限制比文心一言要严苛,撰写水平也不能满足我的要求,且反应速度稍显迟缓。”

针对用户反馈“360 AI助手”使用体验不佳的情况,江瀚表示,这反映了当前AI大模型在理解自然语言指令和意图方面仍存在一定的局限性。比如用户期望的是直接的自我介绍,而非写作技巧指导,这要求模型具备更高的上下文理解和情境感知能力。

此时来看,“360 AI助手”将如何超越GPT-4呢?

周鸿祎以实际数据为依据进行了解答,他表示通过收集到的4000个分类的用户数据测试,联合版本在综合评分上显著超越了GPT-4o的得分。

具体而言,据360相关负责人向中国经济时报·中时财经提供的资料来看,“360 AI助手”在综合测评中以80.4分的成绩领先GPT-4o的69.22分,特别是在处理诗歌赏析、职业考试、本土知识问答等方面表现尤为突出。

尽管输赢各有说法,但江瀚表示,“360 AI助手”的推出可能旨在通过不同的技术路径、优化策略或特色功能来满足特定用户群体的需求,或是探索AI技术更多的应用场景。其实际意义在于推动AI技术的多样化发展,促进技术创新与竞争,从而为用户提供更多选择和更好的服务体验。他认为“360 AI助手”与GPT-4等国际领先大模型之间的竞争是一种健康的竞争态势,有利于推动AI技术的快速发展和普及。

同时,江瀚提出,实现“有效解决技术难题,促进模型间无缝集成与协同工作,从而帮助国内大模型在性能上实现对国际巨头的全面超越”这一目标,并非一蹴而就,需要持续的技术投入、优化和创新。同时,国际竞争也会促使我们不断反思和改进自身的技术策略,以更加开放和合作的态度推动AI技术的全球发展。

海量资讯、精准解读,尽在新浪财经APP
360 周鸿祎 AI

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 08-15 小方制药 603207 --
  • 08-12 国科天成 301571 --
  • 08-05 巍华新材 603310 17.39
  • 08-05 珂玛科技 301611 8
  • 07-26 龙图光罩 688721 18.5
  • 新浪首页 语音播报 相关新闻 返回顶部