面对美国政府花费日益高涨的挑战,美国成立了以马斯克为首的政府效率部,旨在实现“精简政府、削减开支、重组联邦机构”的目标。
对此,CRM巨头Salesforce的联合创始人、CEO贝尼奥夫出了一个主意,利用AI Agent,无需人工干预即可执行特定任务的自主智能系统,就可以彻底改变政府的运营,实现报告、审计、案例管理和直接面向公民的服务自动化,既节省了数十亿美元,又消除了延误。
这只是AI Agent的一个应用。随着AI技术的快速发展,AI Agent已经在AI聊天机器人、AI助手等领域取得突破,逐渐成为生成式AI领域的新宠。
比尔·盖茨曾预测,AI Agent将是大模型(LLM)之后的下一个平台。在大模型这场竞争中,如果说上半场卷的是大模型基础能力,那么下半场AI Agent的落地将成为最重要的应用竞争形态。
世界上有数以百万计的中小企业,未来,它们都可以让AI Agent执行客户支持和销售等功能。为此Meta CEO马克·扎克伯格表示,世界上的AI Agent可能比人类还多。
每家企业将不只拥有一个AI Agent
LLM的一个基本应用是AI聊天机器人。它使用生成式AI(GenAI)提供基于单次交互的响应。一个人提出问题,聊天机器人使用自然语言处理进行回复。
GenAI的下一个前沿是AI Agent(AI代理),也有人称为Agentic AI(代理式AI)或者AI智能体,使用复杂的推理和迭代规划来自主解决复杂的多步骤问题,提升各行业的生产力和运营效率,并降低成本。
AI Agent是AI下一个革命。扎克伯格表示,每家企业,就像他们今天拥有电子邮件地址、网站和社交媒体一样,都将拥有不同的AI Agent,执行不同的任务。每个人都可以在自己的手机中内置AI Agent。组织中的每位员工都可以拥有自己的AI Agent来执行日常任务。
“我们现在正在进入一个自主AI Agent的新时代,这些代理可以自行采取行动并增强人类的工作。”Salesforce CEO贝尼奥夫称呼AI Agent为新的“代理时代”,“与云革命一样令人兴奋,并从根本上重新定义人类的工作、生活和相互联系的方式。”
麦肯锡最近的一份报告将AI Agent称为“生成式AI的下一个前沿”。虽然独立软件系统的各个版本已经存在多年,但生成式AI的自然语言功能揭示了新的可能性,使系统能够规划行动,使用在线工具完成独立软件可以完成的任务,与其他代理和人员协作,并通过学习进一步提高效率。
那么,AI Agent到底是什么?科技巨头和初创公司正在布局、探索AI Agent的潜力。然而,一些公司将AI助手、AI聊天机器人与完全开发的自主AI Agent混淆了。
AI Agent由一组指令和AI模型以及可以使用的工具组成。通过这些指令、工具和AI模型,AI Agent可以将AI模型的力量集中在特定任务上,并提供所需的正确信息,从而获得更好的结果。
其中,指令通常是指Agent的角色,如企业的客服,需要执行的任务,以及执行任务的方式,然后通过对话澄清哪个Agent可以帮助他们,检查该Agent的等待时间,最后将具体的请求转给该Agent。
工具使Agent能够执行任务,如一些代码片段,可以运行它们来从其他系统(甚至是其他AI Agent或人类)获取信息。
AI模型可以是任何能够理解和应用指令并使用工具的模型。
目前来看,AI Agent在企业中的应用场景正在不断扩大。AI Agent的潜在应用领域非常广泛,仅受限于创造力和专业知识。从生成和分发内容等简单任务,到编排企业软件等更复杂的场景,AI Agent正在改变各个行业。
常见的应用场景包括客户服务,减少响应时间,并提高了满意度;内容创建,快速创建高质量、个性化的营销内容;日常办公,如安排日程,提取会议纪要,并分发;HR服务,如入职服务、咨询服务等;软件工程,通过自动执行重复的编码任务来提高开发者的生产力;医疗健康,可以提取关键信息,帮助医生做出更明智的护理决策,以及在患者预约中自动执行管理任务并记录临床笔记可减少耗时任务的负担等。
AI正在推动新一轮自动化浪潮,从机器人流程自动化(RPA)转向更复杂的自动化AI Agent。同时,曾经以RPA解决方案占据主导地位的自动化公司现在正在采用基于代理的系统。RPA时代的中心是创建软件机器人来处理重复的、基于规则的任务。这些机器人成为许多企业自动化战略的基础,自动执行可以分解为确定性决策的任务,即结果是确定的决策。
作为回应,自动化平台正在采用AI Agent,以实现更大的灵活性。与机器人不同,代理可以管理概率决策,意味着他们可以实时适应各种结果并从中学习。这种动态能力使代理能够超越简单的自动化,开始在工作流程中充当协作者。
AI Agent提供动态、适应性强的工作流程,能够管理结构化和非结构化决策流程。虽然机器人继续处理基于规则的任务,但AI Agent正在介入以管理更复杂的概率决策,从而提高运营效率。未来行业领导者越来越关注平衡人机协作的多模式AI系统,从而开创企业工作流程的变革时代。
大模型企业筑起AI Agent护城河
在生成式AI时代,每个企业都在尝试构建自己的AI应用,来赋能企业提高业务能力,提高盈利预期,提高生产效率。但企业面临着诸多来自于算法技术、数据质量、数据隐私、计算效率和成本等的挑战。
越来越多的大模型公司和科技企业都开始布局AI Agent,以帮助企业解决上述挑战。而LLM企业和云服务商拔得头筹,在AI Agent中占据明显的优势。
阿里推出AI Agent框架Qwen Agent,可以构建各种能执行复杂任务的AI Agent。Qwen Agent是一个基于Qwen 2.0的指令遵循、工具使用、规划和内存功能开发LLM应用程序的框架。阿里已经开源了这一框架,同时它还附带了浏览器助手、代码解释器和自定义助手等示例应用。
Qwen-Agent有指令遵循、工具使用、规划和记忆能力。用户可以用它来构建各种能执行复杂任务的AI Agent,可以调用工具,如计算器、搜索引擎等,可以处理长文档等,也可以调用如浏览器助手、代码解释器、自定义助手等应用。
在可访问性方面,用户可以使用阿里云DashScope的模型服务,也可以使用开源Qwen模型部署和管理自己的模型服务。
另一个科技巨头腾讯云推出的一站式智能体开发平台——腾讯元器,用于帮助用户创建和管理各种AI智能体。腾讯元器允许用户通过简单的操作来构建、发布和部署智能体即AI Agent,并且支持将这些智能体发布到多个渠道,如QQ、微信客服、微信小程序和微信公众号等。
这一平台集合了提示词、插件、知识库和工作流四大功能模块,其中提示词模块允许用户精细设定智能体的行为模式、回应方式等;插件模块则提供包括网页解析、图片理解等在内的多种插件,并支持用户自定义插件,以满足更广泛的需求;知识库模块支持导入多种格式的知识文件,增强智能体的知识储备能力;而工作流模块作为一种低代码编辑工具,使用户能够灵活编排插件、知识库与大模型节点的工作顺序,从而实现对任务逻辑的精确控制。
腾讯元器的底层大模型能力来自其混元大模型。此外,腾讯元器平台积极推动社区建设,鼓励用户参与到插件生态的创作与发布中,共同推动平台生态的发展。
而智谱AI在AI Agent方面最新成果尤其亮眼。智谱AI CEO张鹏宣布旗下自主任务完成智能体AutoGLM再次升级,支持自主执行超过54步的长步骤操作,也可以跨App执行任务。
智谱AI展示了在AI Agent(智能体)方面最新成果,发布了用AI替代人类执行任务的三款智能体,分别是面向手机的Phone use——AutoGLM,面向电脑的Compute use——GLM PC,以及面向网页的GLM-Web能力。
其中,基于PC的自主Agent——GLM-PC,面向会议预定、文档处理、网页搜索及远程指令发送等场景进行内测。
作为全球最大的云服务商AWS推出Multi-Agent Orchestrator,可提供用于管理多个AI Agent和处理复杂对话的解决方案。该框架将查询路由到最合适的代理,维护对话上下文,并与各种环境集成,包括无服务器算力AWS Lambda、本地设置和其他云平台等。
其带有的编排器支持Python和TypeScript,支持双语言实现,允许来自代理的流式和非流式响应,并包含用于快速部署的预构建选项。此外,它还提供广泛的功能,如智能意图分类、上下文管理和新代理的可扩展集成性。
AWS还在GitHub上重点介绍了其拥有的6个专业代理的功能,包括用于旅行、天气、数学和健康的代理。编排器在代理之间切换,以管理多轮次对话和各种任务,同时保留上下文。
同样,IBM也推出了一个开源工具包Bee Agent Framework,用于大规模创建和部署基于代理的工作流程。目前,Bee Agent处于Alpha测试阶段,支持各种AI模型,并提供与IBM Granite和开源的Llama 3.2模型的兼容性。
AI算力的大拿英伟达也不放过这一机会。2024年8月,NVIDIA发布规范生成式AI用例的参考工作流NVIDIA NIM Agent Blueprint,帮助企业和开发者解决AI Agent管理问题。
NIM Agent Blueprint包括合作伙伴微服务、一个或多个AI Agent、参考代码、自定义文档和用于部署的Helm图表。通过NIM Agent Blueprint,开发者能够迅速开始创建使用一个或多个AI智能体的AI应用,包括使用NVIDIA NeMo、NVIDIA NIM与合作伙伴微服务构建的示例应用等。
企业可以使用自己的业务数据修改NIM Agent Blueprint,并在加速的数据中心和云中运行其生成式AI应用。借助NIM Agent Blueprint,企业可以根据用户反馈不断完善其AI应用,形成一个数据驱动型的AI飞轮。
包括埃森哲在内的英伟达合作伙伴正在帮助企业通过NIM Agent Blueprints构建的解决方案来使用AI Agent。加拿大渥太华医院使用NVIDIA AI驱动的德勤 Frontline AI Teammate来部署AI助手,以提供更好的患者体验并减轻管理负担。
德勤的Frontline AI Teammate使用NVIDIA AI Enterprise和德勤对话式AI框架构建,能够实现医疗环境中的人机交互。德勤逼真的虚拟化身在NVIDIA Omniverse平台上开发而成,能够回答在医疗健康服务中至关重要的复杂医疗领域问题。
企业服务巨头出手AI Agent
在各个行业和工作职能中,生成式AI正在通过将大量数据转化为可操作的知识,帮助员工更高效地工作,从而改变企业组织。
目前,不同企业推出的AI Agent,正在逐渐覆盖企业办公、财务、HR、客户服务管理、IT服务管理等各个领域。
Oracle推出50+个AI Agent,可自动执行财务、HR等领域的任务。Oracle公司在2024年宣布将50多个专业AI Agent集成到其Oracle Fusion Applications Suite中。AI Agent将自动执行财务、人力资源、供应链、销售、营销和客户服务等关键领域的日常任务,使员工能够专注于更具战略性的计划。
由生成式AI提供支持的新AI Agent旨在自动化端到端业务流程,并提供个性化的见解和建议。例如,在人力资源领域,“轮班安排助手”帮助管理员工轮班,同时确保遵守法规;而在财务领域,“高级预测代理”使用AI模型生成准确的收入预测。
另外,Oracle Fusion Applications Suite支持企业通过在单个云平台上管理多个业务流程来标准化运营并打破孤岛,这种持续创新会定期更新,以帮助组织适应不断变化的业务需求。
SaaS领头羊Salesforce推出了Agentforce平台,一个用于构建自主AI Agent的低代码/无代码平台,使公司能够创建、定制和部署人工智能驱动的自主代理,以支持客户和员工的工作。
Agentforce不仅利用低代码工具让用户轻松创建代理,而且还宣称“每个应用中都有Agentforce”,将这一技术融入到Sales、Service、Marketing等多个云平台中,覆盖了丰富的使用场景。
这种广泛的适用性和强大的智能化能力,使Agentforce在用户体验和数据个性化方面远超传统的AI工具。据称,Salesforce客户已经有大约2亿个AI Agent 处于试用阶段。AI Agent的数量可能在短短两年内达到10亿大关。
全球最大的软件公司微软CEO Satya Nadella:“Copilot是AI的UI”,理想情况下,每个员工都会有一个了解他们、了解他们的工作、帮助他们提高生产力、增强工作并节省时间的Copilot。
微软的Copilot在2023年末的Ignite大会上首次发布,2024年推出了Copilot代理,整合到Microsoft 365的生态系统中。
这家科技巨头在其多个平台上引入了AI Agent,包括帮助用户从特定内容中获取见解的SharePoint代理,用于HR和IT任务的员工自助服务代理,以及用于在Teams会议中高效协作和记笔记的Facilitator代理,Planner中还有一个新的Project Manager代理,可以处理从计划创建到执行任务的所有事情。
用户还可以自定义代理,为它们命名并定义行为以满足特定的业务需求。而微软的Copilot Studio将允许用户创建自动化特定业务流程的代理,而IT部门将拥有管理、保护和测量这些系统的平台。
微软新Copilot Actions现在提供个人预览版,它使用AI来自动执行重复性任务,包括从自动化会议摘要和生成每周报告,到自动会议准备和处理其他常规工作流程的任何内容。
微软在安全性上更是强调其数据保密措施,如Azure租户边界和严格的数据保护协议,确保组织的数据安全。
HRM软件之王ServiceNow于2024年9月推出了自己的AI Agent——Now Platform,包括ServiceNow AI Agents,旨在提高IT、客户服务、人力资源和采购等部门的全天候生产力。
ServiceNow AI Agent使用高级推理并通过Now Platform以跨企业数据为基础,从更熟悉的基于提示的活动,发展到深入的上下文理解,让人们参与其中,以实现强大的监督和治理。
最先实现的ServiceNow AI Agent包括客户服务管理(CSM)和IT服务管理 (ITSM)AI Agent。未来,使用ServiceNow的多模态AI,AI Agent将能够从语音、视频和图像等输入中提取上下文,并提供个性化、相关的响应,最终通过 IT、客户服务、采购、人力资源、软件开发等领域的数百个用例大规模推动全天候生产力。
通过比较企业服务领域的AI Agent,我们发现其几个共性:
第一,推出了相应的平台或者框架,完成AI Agent的创建与不同AI Agent的管理。一些平台更带有低代码/无代码功能,方便用户AI Agent的创建。
第二,在功能性方面,AI Agent因为应用领域不同,目前完成的大多是重复性、简单性的工作,如客户服务、咨询服务、员工自助等,未来应用领域会更多,更复杂。微软的Copilot虽覆盖面广,但是对于普通人而言“杂乱无章”。
第三,在易用性方面,Salesforce利用低代码/无代码,ServiceNow的Now Learning和Now Assist Skills Kit等,都提供了丰富的学习和开发支持,微软则推出简化版的工具等,方便各级用户使用。
第四,在大模型支持上,不同的企业都支持自己的大模型或者开源的大模型,未来企业在创建AI Agent时,大模型的选择和微调就显得尤为关键。
最后,在安全性与信任,保护用户数据成为关键。目前,数据安全是每个平台都重视的重点,不同的企业都非常重视数据安全,否则将会出现混乱。
黎明就在眼前
AI Agent应用前景被看好。Research and Market报告认为,AI Agent市场预计将从2024年的51亿美元增长到2030年的471亿美元,2024-2030年的复合年增长率为44.8%。
软件框架LangChain最近发布了一份调查报告,51%的受访者表示已经在生产中使用AI Agent,63%的中型公司在生产中部署了代理,78%的公司有集成AI Agent的计划。
AI Agent将在人际协同、多模态、多AI Agent、具身智能等方向发展。未来,AI Agent不再只是执行简单命令的程序,而将具备更深层次的理解和推理能力,能够与企业中的员工进行更加自然和深入的交流。AI Agent将学会调用外部工具获取所需信息,甚至能够自我反思和学习,以优化自己的行为和决策。
人机协同正在成为AI Agent新常态,这种协同模式将使人类与AI共同参与工作流程,AI提供建议并协助人类完成工作,此时更多的还是以工具的身份出现。AI Agent也将朝着更具人格特征和情感识别能力的方向发展,以提供更自然、更个性化的交互体验。
随着多模态融合技术的发展,AI Agent能更好地理解和回应员工的指令,就像人一样,能听、能读、能看、能感觉,将使得AI Agent可以应用于更广泛的领域,如医疗诊断、自动驾驶、智能安防等。
未来的AI Agent也将从“单打独斗”向“团队合作”方向发展,能够模拟复杂的工作和决策过程。正如人与人之间的合作一样,在多智能体系统(MAS)中,每个智能体都有自己的职责和任务。
在世界运行AI Agent之前,还有很多流程、安全和其他挑战需要处理。
构建值得信赖的AI Agent系统涉及解决以前从未存在过的问题。虽然潜力巨大,但最大的挑战之一仍然是数据编排。许多公司都在努力解决如何跨平台管理和协调数据的问题。科技公司正在积极研究解决方案,专注于构建正确的基础设施来支持AI Agent和机器人,确保AI驱动的自动化能够满足复杂工作流程的需求。
数据安全什么时候强调,都不过分。企业和组织不会为小型语言模型或大型语言模型付费,只会都为系统的结果付费,因此允许系统提取专有数据并将其用于竞争优势,无论该系统是什么。如果因此而造成数据泄露,将贻害各方。
如果你以为AI Agent会向洪水一样蔓延,那么作为企业的员工,你应该担心自己会被AI替代。如何管理好这些不同的AI Agent,未来或许需要一个管理的AI Agent。
文:放飞 / 数据猿
责编:凝视深空 / 数据猿
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)