360组“联盟”与GPT-4 互争雄长，胜算几何？|360_新浪财经

作者：邸睿芳

编辑：张丽敏

制图：张宇萱

“如果把GPT-4比喻成灭霸，我们要组成一个‘复仇者联盟’。”8月4日，360集团创始人周鸿祎在社交媒体平台上透露：“公司近期整了个大活儿，打算通过联盟的力量超越GPT-4。”

周鸿祎显然是个明白人，知道单靠一家大模型厂商是没法和GPT-4掰手腕的。于是，经过分析，周鸿祎表示，能不能让国内大模型团结在一起，通过360集团发明的COE架构，即Collaboration-of-Experts（专家协同模型），把16家大模型逻辑上合成一个虚拟的大模型，每个大模型发挥各自的优势，集合大家的优点实现对GPT-4的全面超越。

很快，这个由16家大模型组成的AI搜索应用“360 AI助手”就上线了。然而，任何新生事物都免不了面临质疑。毕竟，要把16家大模型在逻辑上合为一体，这在技术上、利益分配上等都是一道道难题。更不用说，一些用户在试用后忍不住吐槽：“‘360 AI助手’的回答简直让人抓狂，还不如用我常用的语言类大模型呢。”

看来，要想实现这个项目的成功和可持续发展，还要克服重重挑战，这才能真正打造出一个强大的“复仇者联盟”，与“灭霸”一较高下。

01 集中力量办大事？

周鸿祎在题为“中国16家大模型组建‘复仇者联盟’ 超越美国GPT”的视频中，亮出了合作的“三板斧”。

首先，他强调了打造COE架构的重要性，该设计相当于通过技术工作流把国内大模型连在一起。当用户输入要求时，360将捕捉用户意图，并判断用户所需大模型的类型，随后调度相应领域内表现最好的一个或多个国内大模型协同作业。

盘古智库高级研究员江瀚在接受中国经济时报·中时财经采访时，对COE架构进行了剖析，认为该设计技术可行性存在，但这种尝试极具挑战性。

“首先，COE需要解决的关键技术难题有很多，比如，模型间接口的统一与标准化、数据共享与隐私保护、模型间决策冲突的解决机制等，以及如何在逻辑上无缝集成各模型的输出以形成一致的响应。其次，技术难题还体现在模型的兼容性和互操作性上，确保不同厂商开发的模型能够顺利接入并协同工作。此外，如何评估并优化合成模型的性能，确保其优于单独模型的总和，也是一个复杂的问题。”江瀚如是指出。

接着，周鸿祎介绍了“第二板斧”——定位各模型专长。针对传统测试方法的局限性，360做了一个AI搜索，其有海量真实用户数据，细分出4000多个类别，对国内大模型进行了全面评估，从而获得了各模型能力特长的画像。这一举措不仅为各大模型量身定制了能力标签，更为后续的调度打下了基础。

至于“第三板斧”——如何说服多家来合作，周鸿祎表示，国内大模型企业越来越意识到人工智能成为国家发展的重要引擎，也意识到合作的重要性。在“携手合作，超越美国GPT”的共同愿景下，360的倡议得到了广泛响应，昔日的竞争对手如今也携手并肩迈向新征程。

据360集团相关负责人向中国经济时报·中时财经提供的资料来看，除去360其他15家国内大模型分别为智谱、商汤、百川智能、火山引擎、百度智能云、腾讯混元、讯飞星火、华为、MiniMax、零一万物、面壁智能、Deepseek、学而思、九章大模型、Kimi。

萨摩耶云科技集团首席经济学家郑磊在接受中国经济时报·中时财经采访时对于这种合作模式给予了正面评价，认为它能够发挥各大模型的优势，属于大模型领域的一种新的商业模式。

在这种新商业模式下，考虑到参与合作的各家的不同商业目标和利益诉求，构建一个公平高效的合作机制或许尤为关键。

郑磊分析道，从理论上讲，国内大模型厂商根植于不同行业，其训练数据各具特色，因此大模型也会表现出某些方面更强的特点。如果能够通过一种合理的利益分配模式把它们结合在一起，应该可以超过单一的大模型。

不过，郑磊提醒道，目前分类可能过细了，虽然各有所长，但共性还是主要的，因此在分配任务方面恐怕难以做到公平合理，这将影响到各家厂商在收益方面的分配。此外，这种联盟本身也会出现法律灰色地带，如服务定价，可能会涉及到垄断。

尽管如此，鉴于目前大模型行业赢利较困难，商业模式还不够成熟，郑磊鼓励各方以开放的心态参与这一尝试，共同探索合作的可能性。

02 体验分化，如何实现超越？

当前，360已将“360安全卫士桌面”与“360浏览器”打造为通往“360 AI助手”的便捷门户，吸引了不少用户纷至沓来。然而，用户使用后的反馈却不尽相同。

小忆作为“360 AI助手”的首批尝鲜者之一，在某社交平台上表示：“这种一站式服务太赞了，能让我一次性体验国内众多主流大模型。更绝的是，面对同一问题，我可以切换不同大模型的视角，还能对比答案，给这种人性化的设计点赞！”

然而，并非所有用户都沉浸在喜悦之中。阳阳在接受中国经济时报·中时财经采访时表达了对使用体验的不满。她提及，当要求“360 AI助手”进行自我介绍时，却只收获了撰写自我介绍的技巧指南，而非它的个人介绍。即便重复指令，也只换来了一篇虚构的跳槽经历，令人啼笑皆非。

还有悦悦，一位从事文秘工作的人士，对于“360 AI助手”的文本处理能力同样向中国经济时报·中时财经表达了不满：“输入字符的限制比文心一言要严苛，撰写水平也不能满足我的要求，且反应速度稍显迟缓。”

针对用户反馈“360 AI助手”使用体验不佳的情况，江瀚表示，这反映了当前AI大模型在理解自然语言指令和意图方面仍存在一定的局限性。比如用户期望的是直接的自我介绍，而非写作技巧指导，这要求模型具备更高的上下文理解和情境感知能力。

此时来看，“360 AI助手”将如何超越GPT-4呢？

周鸿祎以实际数据为依据进行了解答，他表示通过收集到的4000个分类的用户数据测试，联合版本在综合评分上显著超越了GPT-4o的得分。

具体而言，据360相关负责人向中国经济时报·中时财经提供的资料来看，“360 AI助手”在综合测评中以80.4分的成绩领先GPT-4o的69.22分，特别是在处理诗歌赏析、职业考试、本土知识问答等方面表现尤为突出。

尽管输赢各有说法，但江瀚表示，“360 AI助手”的推出可能旨在通过不同的技术路径、优化策略或特色功能来满足特定用户群体的需求，或是探索AI技术更多的应用场景。其实际意义在于推动AI技术的多样化发展，促进技术创新与竞争，从而为用户提供更多选择和更好的服务体验。他认为“360 AI助手”与GPT-4等国际领先大模型之间的竞争是一种健康的竞争态势，有利于推动AI技术的快速发展和普及。

同时，江瀚提出，实现“有效解决技术难题，促进模型间无缝集成与协同工作，从而帮助国内大模型在性能上实现对国际巨头的全面超越”这一目标，并非一蹴而就，需要持续的技术投入、优化和创新。同时，国际竞争也会促使我们不断反思和改进自身的技术策略，以更加开放和合作的态度推动AI技术的全球发展。