走出最后一个AI寒冬,21世纪第三个十年见证了现代AI的诞生。
斯坦福大学教授、“AI教母”李飞飞将当前AI领域的变化描述为科技领域的“寒武纪大爆发”。回顾过去一年,Scaling Law驱动的新范式开始告别参数规模崇拜;多模态AI生成能力涌现多个爆款应用,打开了全新的竞速空间,也为即将到来的2025年带来了诸多可能性。
12月,微软亚洲研究院、中金研究、红杉资本、Wired等发布了多份新年技术趋势展望报告,其中端侧大模型、智能代理等成为多个机构加注的焦点,值得行业长期关注。
一、计算成本呈每年十倍速下降,大模型向端侧及边缘侧落地
目前,动辄数十亿美金的计算资源投入和昂贵的推理费用正在削弱生成式人工智能的创新能力。为了实现新的技术突破,大型语言模型(LLM)迫切需要变得更加精简、效率更高、成本更低。在《WIRED》杂志的《2025年趋势展望》特刊中,李开复博士预计,2025年将成为一个关键的转变点,届时将有大量以AI为核心的应用出现,这些应用将得益于性能卓越但更加经济的模型。
李开复博士认为,当前硅谷巨头如OpenAI、谷歌、xAI等公司不惜重金的投入造就了一个不均衡的生态。由庞大的GPU集群训练出的大模型,推理成本高昂,最终会转嫁到所有使用这些大模型的应用上。这种失衡生态使英伟达成为最大受益者,同时也让应用开发者面临艰难抉择:要么只能使用低成本、低性能的模型,但这显然无法满足用户期望;要么承担高昂的推理成本,冒着极大的风险开发应用。
李开复博士预测,到2025年,一种新模式将有望打破这一僵局——随着新一代人工智能算法的优化、更先进推理技术以及更具成本效益芯片技术的发展,AI推理成本有望实现每年十倍的降低。
随着计算成本的大幅降低,更轻便的终端应用将迅速增长。东兴证券的研究报告指出,人工智能终端市场潜力巨大,覆盖了个人电脑、智能手机、可穿戴设备等多个领域,人工智能终端在短期、中期和长期均显示出明显的增长趋势。
在AI PC领域,传统PC的普及率已接近饱和状态,而AI PC通过提供智能化体验可能会开辟新的增长机会。根据IDC的预测,AI PC在中国PC市场的新设备中所占的比例将在接下来的几年内迅速上升,预计到2027年将达到85%,成为市场的主导力量。
在AI手机领域,据中国报告大厅的分析预测,2024年搭载AI功能的手机渗透率有望增至16%,而到了2026年,AI 手机的出货量预计将突破4.7亿部,渗透率增至38%。AI大模型与智能手机的结合有望激发新的换机浪潮,推动整个行业的发展趋势。
在AI可穿戴设备领域,市场规模预计将从2024年的419亿美元增长至2028年的1207亿美元,CAGR达到30.3%。增长主要得益于消费者对可穿戴设备兴趣的显著提升、与智能手机的进一步整合、医疗健康应用的扩展以及针对老年人护理的可穿戴设备的开发等因素。年末,智能轻奢品牌BUTTONS与AIoT企业特斯联合作打造的首款智能体耳机,硅谷明星创企Friend AI智能项链的量产均印证了智能可穿戴设备的爆发趋势。
大语言模型轻量化、实惠化趋势之下,边缘计算市场亦将迎来进一步扩张。不久前,我国信通院发布了《边缘计算产业发展研究报告(2024年)》。《报告》指出,我国的边缘计算市场处于稳步增长阶段,自2020年以来,边缘计算市场快速扩张,多年年均增长率超过40%。
2024年6月,由特斯联与中科院重庆研究院合作共建的重庆首个省级“边缘智能计算重庆市重点实验室”正式落地重庆高新区。该实验室即旨在围绕边缘智能与计算服务等场景开展全方位科研合作。实验室副主任、特斯联首席科学家杨旸博士在揭牌仪式上提出,随着5G技术的发展,及其所支持的物联网场景的发展,数据风暴业已冲击到越来越多的用户——通信网络有越来越多的数据无法上传;网络阻塞导致了越来越惨的服务时延。这使得边缘智能的重要性凸显。
据实验室管理委员会委员、特斯联高级副总裁刘斌博士透露,作为我国AIoT行业的代表企业,特斯联亦在持续通过边缘智能计算,推动大模型在边缘侧及端侧的落地。“针对边缘,特斯联打造了系列边缘计算产品,目前已经可以部署10B规模、百亿级的大模型。端侧大模型、边缘侧大模型、云端大模型,根据不同场景分别部署、协同,将能解决不同客户,不同场景的不同需求。
二、多模态释放无限可能,AI Agent或将诞生爆款应用
尽管大模型打开了AI向前发展的诸多象限,然而值得注意的是,当前头部AI企业仍面临着不小的盈利压力。商业化承压之下,头部AI企业纷纷开始“推陈出新”,以寻求破局之道。一方面,OpenAI于9月发布了o1推理(Reasoning)模型系列。o1采用了全新的基于思维链的强化学习训练技术。这种训练方式使得o1模型在面对需要多层次推理的任务时,能够展现出与人类专家相当的表现。通过强化学习,o1模型学会了如何完善自己的思维过程,尝试不同策略,并认识到自己的错误,从而不断提升其推理能力。
另一方面,越来越多的企业正在尝试利用人工智能技术,实现不同模态数据间的相互理解和转换。谷歌云日前发布《2025年人工智能商业趋势报告》指出,多模态AI模型能够处理来自文本、图像、音频和视频的信息——这与人类的大脑非常相似。报告认为,这将实现更直观的交互,并提高AI输出的准确性。报告预测,2025年将是企业AI采用的关键一年,这在很大程度上是由多模态学习和它所提供的环境感知能力推动的,同时预计2025年全球多模态AI市场规模将达到24亿美元。
这一趋势推动下,多模态在金融、医疗、营销、工业、娱乐等多个领域都将迎来更广阔的应用。例如,在医疗领域,多模态AI可以通过整合医学影像、文本信息(如病历)、病理报告等多种数据,辅助医生进行更全面、准确的临床决策;在个性化营销领域,多模态AI能够提供更深入的消费者洞察,帮助品牌实现“千人千面”的个性化营销策略,提升用户体验和满意度,同时AI技术通过分析用户的历史数据和行为模式,预测用户的兴趣和需求,实现个性化推荐,提高转化率……
多模态灵活转换背景下,AI应用业已从聊天机器人进化到能够处理复杂工作流程的Copilot及AI Agent(智能代理/智能体),对智能时代的生产关系进行着深刻重塑。
在2024年11月落下帷幕的科技盛会Web Summit上,AI Agent亦成为多家智能企业、多位智能产业领袖的讨论焦点。高通总裁克里斯蒂亚诺·阿蒙(Cristiano Amon)在峰会现场指出,AI驱动的智能体将成为人类充分利用AI带来全新机会的关键所在。阿里国际总裁张阔则在峰会重磅发布了阿里国际的B2B AI搜索智能体Accio。“用户可通过“大白话”来询问AI、提出需求,Accio会通过多轮对话,梳理用户需求,并像一位真正的代理商一样,通过专业的B2B行业知识拆解需求、给出建议。”
特斯联创始人兼CEO艾渝则将AI Agent的触角延伸至消费场景。他在Web Summit的中央舞台发布了由特斯联与BUTTONS联合打造的第一代通用智能体Hali,并将Hali区别于普通生成式AI/大模型的特点总结为:类人思考能力、长期记忆能力、高维感知能力及多智能体协同能力,其通过可穿戴设备实现与用户的实时交互及与其他智能体的无缝协作,成为用户的助理乃至伴侣。
2024常被称为“智能体元年”,无论是日益深入垂直行业场景的To B智能体,还是与消费电子产品紧密绑定的To C智能体,多智能体协同已成为显著趋势。根据Grand View Research的数据,尽管单一智能体系统在2023年仍然占据了最大的市场份额,然而多智能体系统细分市场预计在2024-2030间将展现出最高的复合年增长率。
艾渝在Web Summit舞台亦分享了其对MAS(Multi-Agent System,多智能体系统)趋势的观察。在他看来,未来世界,智能体的数量或将远超人类数量,每个智能体均具备像人类一样的行动以及思考能力,同时,还能够成为某垂直领域的专家。在这样的前提下,一个能够统筹、协调所有智能体,完成与人类交互的超级通用智能体(AGI Agent)就显得尤为重要。
通用智能体能够依据workflow无代码生成多个智能体;同时,基于其背后大模型的思考、规划能力,通用智能体能够实现对多个智能体的统一调度、编排。用户通过与通用智能体的简单语言交互,即可获得一整套多智能体协同的系统,从而完成导航、翻译、活动管理、商业分析等诸多任务。
同样是2024年11月,“Microsoft Ignite 2024”全球开发者大会则公布了微软智能体生态的发展状况。据透露,自推出以来,已有超过10万家组织通过其Copilot Studio创建或编辑过智能体。Copilot Studio集成了1400多种企业系统和数据源,范围从SAP到ServiceNow、再到SQL数据库。智能体生态的快速生长,使得企业在智能体间无缝协作成为可能。
三、视觉空间智能将迎全新突破
此外值得注意的是,当前生成式AI的多模态泛化仍基于语言,而视觉空间智能有望在2025年实现进一步突破。
24年4月,斯坦福大学教授李飞飞与联合创始人Justin Johnson正式推出了他们的创业公司World Labs,专注于空间智能领域。在接受媒体采访中,李飞飞表示,空间智能与语言同样重要,是AI的根基之一。李飞飞定义了AI的终极目标,即赋予机器在三维空间中感知、推理和行动的能力,她将其称为“空间智能”,并强调,未来的AI不仅要理解文本和图像,还必须能够在现实世界中进行复杂的交互,这正是World Labs的使命所在。
据全球市场调研机构Omdia报告显示,2024年,全球空间计算市场规模达45亿美元,并预计到2029年将超过100亿美元,复合增长率达18%。
2024年底,World Labs推出了其首个空间智能AI模型,Large World Model。该模型能够将AI模型从2D像素平面提升到完整的3D世界(包括虚拟和现实世界),赋予人工智能生成、推理和与三维世界互动的能力。据World Labs透露,该司计划在2025年基于Large World Model推出首款产品,支持AR、机器人、自动驾驶等领域。
展望2025,空间智能或许将在当前以语言模型为主导的智能产业场域打开全新竞速赛道,为AI在应用侧的发展带来除Copilot、AI Agent之外的第三种答案。新的一年会否诞生新的架构、新的模型?大模型极尽压缩后将催生怎样的全新场景?异构智能体的协同将产生怎样的火花?有待时间作进一步解答。
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)