近日,昆仑万维(37.530, 0.03, 0.08%)携手北京智源人工智能研究院、新加坡南洋理工大学、北京大学等顶尖名校机构,提出通用计算机控制框架Cradle,使AI Agent无需训练便能像人一样直接控制键盘鼠标,不依赖任何内部API,实现任意开闭源软件交互。
Cradle是迄今为止第一个既能玩多种商业游戏又能操作各种软件应用的AI框架,其论文、项目、代码均已开源。

Cradle不仅能够在游戏《荒野大镖客2》中完成长达40分钟的主线任务,在《星露谷物语》中清理农场、种地、购物,在《城市天际线》中建造出千人小镇,在《当铺人生2》中和客户讨价还价,最高获得87%的周收益率;还能够用Chrome浏览网页、用Outlook发送邮件、用飞书办公;甚至能用美图秀秀修图,用剪映剪辑视频,成为真正的全能AI Agent。
GCC:通用计算机控制

随着大模型的发展,越来越多的智能体(AI Agents)研究关注计算机控制,包括浏览网页、操作智能手机、玩游戏等。然而,已有研究依赖软件内部API获取输入,并输出预先定义好的动作,无法真正像人类一样通过眼、脑、手的配合操控计算机。
要构建能完成计算机上一切任务的通用智能体,必须使用最通用和最标准的输入输出与计算机进行交互。因此,通用计算机控制使用统一的输入和输出,从而让智能体的通用性变为可能。
但通用性带来了操作上的难度:
(1)使用计算机屏幕作为输入对智能体的视频理解能力提出了更高的要求,例如由于没有内部API,需要通过视觉信息判断动作是否执行成功;
(2)使用键盘和鼠标操作作为输出使得智能体需要更高的时空操作精度,比如键盘按键和鼠标点击通常额外涉及时间维度;
(3)许多计算机上的复杂任务往往需要连续执行成百上千次的正确操作才能完成,是智能体的长程规划决策和历史信息维护处理能力的一大挑战;
(4)虚拟世界中多如繁星的环境和任务是对智能体高效探索并自我提升实现通用性的一大考验。
这些难题成为了构建通用计算机控制智能体(GCC Agents)的挑战。
六大模块,三大环节
Cradle一共由6个模块组成:信息收集、自我反思、任务推断、技能管理、行动规划,以及记忆模块。
Cradle高度的通用性来源于其对和电脑交互过程中的原始输入输出的合理封装和抽象,以从屏幕中显示的视频图像作为输入,提取其中的文本和视觉信息进行决策,并且输出最底层的操作系统中控制键盘和鼠标的信号去和电脑交互,使得其可以不依赖于任何假设和任何内部API进行交互。

同时,Cradle强大的决策推理模块让其得以自发和软件进行交互并且完成任务,这个过程可以被简单地总结为:反思过去,总结现在,规划未来。
反思过去:Cradle使用执行过往动作过程的视频作为输入,分别提取出其中关键的文本和视觉信息,通过反思来判断上一步动作是否执行成功任务是否完成以及如何改进。
总结现在:反思完之后,Cradle需要总结当前情况,并且以此为根据来决定是否更换任务目标或是修改任务内容。
规划未来:最后Cradle会根据当前任务以及现状生成或者更新自身的技能,并且从已经学会的技能中检索一部分和当前任务相关的技能作为备选,然后从中选取合适的技能实例化为动作去执行。

在决策推理的同时,Cradle还会周期性地总结和维护储存在情境记忆中的历史信息以及储存在周期性记忆中的技能。在此过程中,Cradle为其添加了记忆,总结和反思的功能,进一步提升了其对于决策过程中的观察和行为的理解。
Cradle能直接根据游戏内的提示和教程或是自我探索的方式生成对应的操作键鼠的可执行代码作为技能,一步步丰富自己的技能库,并在之后的游戏中重复使用这些技能。

游戏办公全精通
为了验证Cradle的通用性,研究者们选择了4款风格迥异,操作各不相同的经典游戏进行测试,从第三视角的3D角色扮演类游戏《荒野大镖客2》到2D固定视角的模拟经营类游戏《星露谷物语》到俯视角的城市规划类游戏《城市天际线》再到侧重交易策略的模拟经营类游戏《当铺人生2》,并分别设计了不同的任务。
在通用软件方面,Cradle团队也同样选择了5款常用软件进行测试,包括Chrome、Outlook、CapCut(剪映)、Meitu(美图秀秀)和Feishu(飞书)。

Cradle在《荒野大镖客2》的主线剧情任务以及开放世界任务中均有出色表现,能够连续完成长达40分钟的2个完整主线任务,骑马、战斗、购物样样在行。

Cradle在其他游戏任务中均能胜任。在《城市天际线》中修路、保障水电供应,合理划分居民、商业和工业区,建立起千人小镇;在《星露谷物语》中清理农场杂物、种地收获作物、购买种子;在《当铺人生2》中在和客户讨价还价近2轮后以93.6%的交易成功率达成了平均39.6%的周收益率。

Cradle在日常软件应用的各项任务执行上表现不俗,如论文下载、发邮件、修图、剪视频、发送飞书文件等。

同时,Cradle在非常有挑战性的benchmark OSWorld上也同样击败了使用真值作为标签的基线方法。

最后,Cradle也同样击败了众多常见基线方法,证明了框架各个模块的合理性和必要性。

通往AGI之路
此前,大量关于AI智能体的研究都依赖于计算机内部API的信息获取,无法让AI真正“像人类一样”通过眼、脑、手的配合与计算机进行互动,其环境、行为、动作都相对固定,难以实现跨软件、跨平台的通用智能。
Cradle极大程度地扩展了智能体可以交互的范围,并且证明了将一切软件转化为测试智能体不同能力的testbed的可能性,其所提出的通用计算机控制的设定统一了输入输出的接口,促进了统一粒度数据的搜集,为未来Agent在各个环境中交互并且自我提升打下了坚实的基础。
面向数字世界的通用人工智能,正在加速到来。



APP专享直播
热门推荐
两会建言|陈众议:尽早实施十二年义务教育 收起两会建言|陈众议:尽早实施十二年义务教育
- 2025年03月04日
- 14:28
- APP专享
- 扒圈小记
6,037
青工委号召片方抵制劣迹演员
- 2025年03月05日
- 03:26
- APP专享
- 扒圈小记
1,493
短剧顶流何健麒塌房!刚刚,官方发文将其定为“劣迹演员”
- 2025年03月04日
- 16:41
- APP专享
- 北京时间
1,451

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
东方红陈晨今天 23:34:36
【国家金融监管总局:支持科技企业发展 试点将贷款占企业并购交易额“不应高于60%”放宽至“不应高于80%”】财联社3月5日电,金融监管总局近期组织开展适度放宽科技企业并购贷款政策试点工作,聚焦科技企业反映的突出问题,试点适度放宽《商业银行并购贷款风险管理指引》部分条款,支持科技企业发展。对于“控股型”并购,试点将贷款占企业并购交易额“不应高于60%”放宽至“不应高于80%”,贷款期限“一般不超过七年”放宽至“一般不超过十年”。 -
东方红陈晨今天 23:33:57
【石大胜华(sh603026):子公司与宁德时代(sz300750)签订战略合作框架协议 预计供应10万吨电解液】财联社3月5日电,石大胜华(sh603026)(603026.SH)公告称,近日,控股子公司胜华连江与宁德时代(sz300750)签订了《战略合作框架协议》。协议约定,在本协议有效期内(自本协议生效之日起至2025年12月31日),宁德时代(sz300750)向胜华连江采购电解液的需求预计10万吨。公司表示,本协议如果充分履行,将对公司的经营业绩产生积极影响。 -
东方红陈晨今天 23:33:12
【孚能科技(sh688567):公司已与国内头部人形机器人(sz300024)企业对接固态电池相关需求 预计将在年内送样】财联社3月5日电,孚能科技(sh688567)在互动平台表示,在人形机器人(sz300024)领域,公司已与国内头部人形机器人(sz300024)企业对接固态电池相关需求,并根据客户需求进行了定制化开发,目前进展顺利,预计将在年内送样。在低空经济领域,公司已和美国头部eVTOL客户、上海时的、零重力、吉利沃飞等客户达成固态电池领域相关合作。在乘用车领域,公司半固态电池具备高能量密度、高安全性、轻量化、高倍率、长寿命、低成本的优势,获得整车企业客户的高度认可。 -
东方红陈晨今天 23:32:33
【国办:发挥多层次资本市场支持科技创新关键枢纽作用 着力投早、投小、投长期、投硬科技】财联社3月5日电,国务院办公厅发布关于做好金融“五篇大文章”的指导意见。意见提出,加强对实现高水平科技自立自强和建设科技强国的金融支持。推进金融服务科技创新能力建设,统筹运用股权、债权、保险等手段,为科技型企业提供全链条、全生命周期金融服务,加强对国家重大科技任务和科技型中小企业的金融支持。发挥多层次资本市场支持科技创新关键枢纽作用,着力投早、投小、投长期、投硬科技。丰富支持国家重大科技任务的金融政策和工具,健全重大技术攻关风险分散机制。优化科技型中小企业融资环境,发展股权投资、创业投资、天使投资,壮大耐心资本,支持培育发展科技领军企业、独角兽企业和专精特新中小企业。 -
东方红陈晨今天 23:32:00
【国办:加大对突破关键核心技术的科技型企业的股权融资支持力度】财联社3月5日电,国务院办公厅发布关于做好金融“五篇大文章”的指导意见。意见提出,建立健全上市融资、并购重组“绿色通道”机制,加大对突破关键核心技术的科技型企业的股权融资支持力度。优化私募股权和创业投资基金“募投管退”制度体系,引导社会资本加大向金融“五篇大文章”重点领域投资布局力度。加大力度活跃并购市场,支持科技、绿色产业领域高效整合重组。常态化推进清洁能源、养老、新型基础设施等领域符合条件的项目发行基础设施领域不动产投资信托基金。 -
东方红陈晨今天 23:31:45
【国办:深化资本市场投资端改革 壮大权益类公募基金、保险资金、各类养老金等长期投资力量】财联社3月5日电,国务院办公厅发布关于做好金融“五篇大文章”的指导意见。意见提出,培育循环互动的金融市场生态。推动金融领域信息共享,为金融“五篇大文章”重点领域提供多元化接力式金融服务。支持金融机构与科技成果转化、生态环保、中小企业公共服务、养老服务等专业中介机构合作,提升金融服务专业化水平。深化资本市场投资端改革,壮大权益类公募基金、保险资金、各类养老金等长期投资力量。强化会计师事务所、律师事务所、信用评级公司等中介服务机构专业把关责任。 -
东方红陈晨今天 23:31:26
【国办:加大外汇业务和跨境人民币业务便利化政策和服务供给】财联社3月5日电,国务院办公厅发布关于做好金融“五篇大文章”的指导意见。加大外汇业务和跨境人民币业务便利化政策和服务供给。支持金融机构为更多中小企业和贸易新业态提供优质贸易便利化服务,鼓励省级跨境人民币业务自律机制间共享优质企业名单。提升跨境投融资便利化水平,吸引全球资源要素向我国高质量发展重点领域有序聚集。便利绿色项目跨境融资,稳步扩大跨境私募股权投资基金外汇管理政策试点范围。推动银行健全汇率风险管理服务长效机制,丰富完善跨境金融服务平台应用场景。鼓励金融机构持续优化全球网络布局和服务模式,助力中小企业出海拓展业务。 -
东方红陈晨今天 23:31:11
【国办:科学设计、精准实施再贷款等结构性货币政策工具 为做好金融“五篇大文章”提供良好货币金融环境】财联社3月5日电,国务院办公厅发布关于做好金融“五篇大文章”的指导意见。意见提出,加强对金融机构的激励引导。发挥货币信贷政策总量和结构双重功能,科学设计、精准实施再贷款等结构性货币政策工具,为做好金融“五篇大文章”提供良好货币金融环境。优化金融“五篇大文章”领域贷款风险分担机制,发挥政府性融资担保体系增信分险作用。加强财政、货币、监管政策合力,支持做好金融“五篇大文章”。稳妥有序推进金融“五篇大文章”相关改革试点。深入推进现有科创金融、普惠金融、绿色金融等改革试验区建设,重点做好经验复制推广。在风险可控的前提下,支持符合条件的地区围绕做好金融“五篇大文章”依法合规先行先试,与科技创新中心建设、产融合作试点等工作加强协同联动。 -
东方红陈晨今天 23:30:15
【二连板华钰矿业(sh601020):近段时间锑产品价格涨幅较大 存在较大风险】财联社3月5日电,华钰矿业(sh601020)(601020.SH)公告称,公司A股股票连续三个交易日内收盘价格涨幅偏离值累计达20%,属于股票交易异常波动情形。公司主营产品之一为锑精矿,2024年前三季度锑精矿收入占公司总营业收入的10.99%,近段时间锑产品价格涨幅较大,存在较大风险。 -
东方红陈晨今天 23:29:49
【全志科技(sz300458):基于RISC-V架构内核开发的芯片产品已实现量产】财联社3月5日电,全志科技(sz300458)在互动平台表示,公司基于RISC-V架构内核开发的芯片产品已实现量产,应用于多种智能终端设备中。