炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:华泰证券研究所)
2024年是人形机器人学术界和产业界飞速发展的一年,学术界在机器人智能“大脑”的构建方面取得了显著的进展,众多产业巨头也纷纷下场。人形机器人市场一直处于高需求低供给的情况中,高智能化水平机器人供给有望创造自己的需求。建议关注仍存在技术变革的高价值量丝杠/触觉传感器/灵巧手零部件环节。
2024年人形机器人产业回顾:站在技术革命的奇点上
2024年是人形机器人学术界和产业界飞速发展的一年,学术界在机器人智能“大脑”的构建方面取得了显著的进展,众多产业巨头也纷纷下场。我们认为人形机器人的本质是像机器的智能体,长序列复杂任务的执行成功率是衡量智能化水平的关键标准,随着机器人智能化水平提高,其成功率有望显著上升。展望未来,机器人大脑已迎来ChatGPT时刻,我们正站在技术变革的奇点上。人形机器人市场一直处于高需求低供给的情况中,高智能化水平机器人供给有望创造自己的需求。建议关注仍存在技术变革的高价值量丝杠/触觉传感器/灵巧手零部件环节。
具身大模型同样存在Data Scaling Laws,机器人大脑迎来ChatGPT时刻
受到文本大模型启发,人形机器人开始构建具身大模型,首先需解决数据问题。目前,机器人训练数据主要通过动作捕捉、仿真环境合成数据和互联网视频三种方式收集。2024年,英伟达RoboCasa实验通过合成数据训练机器人,显示出减少人工负担的潜力。同年,李飞飞提出的数字表亲概念降低了合成数据成本,提高了仿真到现实的鲁棒性。同年11月,清华大学证明了Data Scaling Laws在机器人操控领域的存在,通过扩展数据集,训练出的机器人策略展现出卓越的泛化能力。我们认为合成数据将大大促进机器人发展,机器人大脑已迎来ChatGPT时刻。
产业巨头纷纷入场,高智能人形机器人有望创造自己的需求
2024年,全球科技巨头在人形机器人领域取得显著进展。特斯拉Optimus展示了其先进的运动控制能力,2025年计划量产千台以上。Figure与OpenAI合作,其新一代机器人已在宝马工厂投入使用。挪威1X推出NEO家用机器人,英伟达发布仿真平台,OpenAI重启人形机器人布局。国内方面,字节跳动、华为等公司也积极布局,智元机器人已量产千台左右人形机器人。我们认为无需担心机器人没有应用场景,市场一直处于高需求低供给的情况中,高智能的人形机器人供给有望创造自己的需求,有望在较为标准的ToB场景中率先应用。
高价值量丝杠/触觉传感器/灵巧手仍存在技术变革可能
我们认为人形机器人的高价值量零部件丝杠、触觉传感器和灵巧手仍存在技术变革的可能。丝杠的产业化目标是实现低成本、短交期和微型化的C5级精度行星滚柱丝杠的量产交付,而现有工艺路径中,磨制/轧制均有产业化落地的可能性,未来有望持续同台角逐,而轧制作为加工效率较高的工艺方式,有后来居上的可能性。触觉传感器有望从单维压力感知发展到多维度数据感知,以完成复杂自适应动作,技术路线包括视触觉和电磁两大类。高自由度和低成本是灵巧手长期的技术追求,特斯拉第三代绳驱灵巧手需解决腱绳长期使用后的蠕变问题,以提升寿命和可靠性。
风险提示:机器人大模型技术进展不及预期、量产化进度不及预期、零部件技术变革不及预期。
2024年人形机器人产业回顾:站在技术革命的奇点上
2024年是人形机器人学术界和产业界飞速发展的一年,学术界在机器人智能“大脑”的构建方面取得了显著的进展,众多产业巨头也纷纷下场。我们认为人形机器人的本质是像机器的智能体,而非像人的机器,长序列复杂任务的执行成功率是衡量机器人智能化水平的关键标准。过去受制于时代技术的发展,机器人智能化水平难以提高。在以ChatGPT为代表的生成式大模型发展浪潮下,通向AGI的道路变得清晰。展望未来,我们正站在技术变革的奇点上,机器人智能化水平不断提高,其高水平供给将创造自己的需求。
具身大模型同样存在Data Scaling Laws,机器人大脑迎来ChatGPT时刻
受到文本大模型的启发,人形机器人也开始构建具身大模型,首当其冲的便是解决数据问题。算法、算力、数据是目前AI的三要素,构建具身大模型首当其中便是解决数据问题。自动驾驶可简化为3D空间中的2D运动,而机器人是3D空间中的3D运动,还需包括力触觉等信息,因此理论上机器人所需数据量高于自动驾驶。目前人形机器人训练数据的收集主要依赖三种方式,第一种是采集真机数据,例如人穿戴动作捕捉服,这种方式数据质量好,但采集成本高速度慢;第二种是利用仿真环境生成合成数据,再对机器人进行训练;第三种是根据现有的互联网视频捕捉动作数据,虽然不需要构建仿真物理引擎,但涉及复杂的坐标转换和缺少力触觉等信息维度。我们认为合成数据将大大促进机器人发展,学界已经证明了上述方式的可行性,机器人大脑已迎来ChatGPT时刻。
英伟达首先证明了合成数据在机器人训练中的有效性:2024年6月英伟达RoboCasa实验表明,采用合成数据训练的机器人在实际任务中展示了巨大的潜力,有望减少数据采集环节的人工负担。RoboCasa使用逼真的物理模拟作为一种手段,来扩展机器人学习方法的环境、任务和数据集。RoboCasa以厨房环境为重点,提供真实多样的场景,提供了超过150个物体类别的数千个3D模型和数十种可交互的家具和家电。为了促进学习,RoboCasa提供了高质量的人类示范,并整合了自动轨迹生成方法,极大地扩展了训练的数据集,减轻了人工负担。实验结果表明,使用合成的机器人数据进行大规模模仿学习呈现出明显的规模效应,并且在实际任务中展示了巨大的潜力。
李飞飞提出了如何降低合成数据成本:2024年10月李飞飞提出的数字表亲,降低了合成数据成本提高了sim – real的鲁棒性,大大促进了机器人仿真训练的发展。虽然仿真环境可以提供低成本且几乎无限的训练数据,但由于仿真和真实环境之间存在物理差异,这种方法存在局限性。数字双胞胎(Digital Twin)作为真实场景的虚拟复制品,可以减少差异,但其生成成本较高且难以实现跨领域泛化。为了解决这些问题,李飞飞提出了“数字表亲”(Digital Cousins)的概念。它并不直接模拟现实世界的对应物,但仍然具备类似的特征功能,能够在减少生成成本的同时,提供一系列相似的训练场景,从而增强sim – real的鲁棒性。实验表明,通过数字表亲方式训练出的策略在零样本仿真到现实的迁移任务中,比基于数字双胞胎训练的策略表现更好,成功率从25%提升至90%。
清华大学补上数据飞轮的最后一环:2024年11月清华大学证明了Data Scaling Laws在机器人操控领域中同样存在,有望成为机器人领域的“ChatGPT时刻”。Data Scaling Laws已在自然语言处理和计算机视觉等领域带来了革命性的进展,赋予了模型卓越的泛化能力。清华团队证明了在机器人操控任务中,也存在类似的数据扩展规律,并且通过适当的数据扩展可以训练出能够在任意环境下零样本部署、处理同一类别中任何物体的单任务机器人策略。实验收集了超过40,000个演示,并在严格的评估协议下执行了超过15,000次真实世界的机器人试验。研究结果揭示了几个有趣的发现:策略的泛化性能与环境和物体数量之间呈现出大致的幂律关系;环境和物体的多样性比演示的绝对数量更为重要;一旦每个环境或物体的演示数量达到一定阈值,额外的演示对性能的提升几乎没有影响。
产业巨头纷纷入场,高智能人形机器人将创造自己的需求
学界取得突破性创新的同时,国内外产业巨头也纷纷入场。海外巨头方面,特斯拉不断通过视频更新机器人进展,并表示明年将量产千台以上的人形机器人;Figure更新其与OpenAI合作的结果,并且推出新一代的机器人在宝马工厂中应用;挪威1X推出NEO进军家用人形机器人领域;英伟达推出人形机器人相关仿真平台;OpenAI开始重启人形机器人领域布局。国内方面,巨头也纷纷开始下场,字节推出机器人具身大模型;华为发起全球具身智能产业创新中心;小鹏/广汽/长安等汽车巨头也推出相应的人形机器人DEMO;独角兽智元机器人也表示2024年全年将量产千台左右的人形机器人。
2024年全年特斯拉Optimus不断放出更新视频,充分体现其运控领先性。2023年底,特斯拉发布Optimus Gen2版本,硬件大幅优化,增加触觉传感器与力传感器。后续更新其行走、叠衣服、摆放电池、上下楼梯等动作。2024年10月10日,WE ROBOT大会上发布最新一代机器人灵巧手,自由度由原来的11个上升至22个,能够实现接球等高难度动作。2024年12月10日,特斯拉展示在不依赖视觉的情况下,Optimus可以实现上下坡,并且在快滑倒时迅速自纠正,展现了Optimus强大的运控能力。
2024年是Figure的商业化元年,已成功在宝马工厂中应用。2024年3月,Figure展示其与OpenAI合作13天后的成果,机器人能够理解自然语言,在人的指令下完成挑选食物、自主摆放餐盘等动作。后续更新的Figure02性能大幅优化,已能够实现在宝马工厂中实现搬运物品、将钣金件放置于模具中等复杂动作。2024年8月,创始人在接受采访时表示Figure目前以1台/周的速度量产,并会在60天内实现2台/周的量产。2024年12月,创始人表示Figure已实现对下游客户的交付。
我们认为无需担心机器人没有应用场景,市场一直处于高需求低供给的情况中,高智能的人形机器人供给将会创造自己的需求。长序列复杂任务的执行成功率是机器人智能化水平的衡量标准,人形机器人有望在较为标准的ToB场景中率先应用。过去Asimo和波士顿动力已经展现出强大的运动能力,但最终商业化落地仍然失败。我们认为这并非是人形机器人没有市场,而是受限于当时的技术水平,机器人智能化水平低,通用性差,导致实际作用有限,商业化放量降本困难。我们认为衡量机器人智能化水平的标准就是长序列复杂任务的成功率。目前,制造业工厂招工要求较低,但单一工位涉及到多个工序,对机器人通用性要求较高。现有多数人形机器人被部署在制造业单一工位的单一环节中,随着未来机器人通用性的提高,高水平供给有望创造自己的需求。
高价值量丝杠/触觉传感器/灵巧手仍存在技术变革
零部件趋于定型,但高价值量方向仍存在技术变革。人形机器人BOM表占比前三大的零部件分别为行星滚柱丝杠、传感器类、灵巧手电机。人形机器人零部件基本定型,但高价质量的零部件技术路径仍存在变化可能性。对于丝杠来说,在精度逐渐降低的背景下,传统磨制丝杠虽然精度高,但是成本高交期长,我们认为采用轧制工艺的C5级别行星滚柱丝杠有望实现广泛应用;传感器方面,现有大部分触觉传感器只能实现压力感知,我们认为未来能够感受到平面多维力、材质、滑动态滚动态等维度信号的触觉传感器有望实现广泛应用;灵巧手方面,我们认为高自由度和低成本是永恒的追求,特斯拉第三代绳驱灵巧手仍需解决腱绳长期蠕变问题。
轧制丝杠有望突破现有磨制方案,实现低成本短交期微型化滚柱丝杠的量产交付
对于丝杠来说,在精度逐渐降低的背景下,传统磨制丝杠虽然精度高,但是成本高交期长,我们认为采用轧制工艺的C5级别行星滚柱丝杠有望实现广泛应用。目前行业内多采用磨制工艺路线制造C5级精度的行星滚柱丝杠,该方式精度高,但需要高精度加工设备,加工时间长导致成本高交期长,并且体积难以做小。若采用车或铣等工艺,虽然能缩短加工时间缩短交期,但仍然需要高精度加工设备,体积也较难做小。因此,我们建议关注采用精轧工艺制造的C5级精度的行星滚柱丝杠,可实现低成本高效率微型化。过去,轧制工艺虽然可以在材料利用率和效率上高于车/铣/磨三种工艺,但精度多停留在C7级。近期行业内公司,如诺仕机器人已实现精轧C5级行星滚柱丝杠的突破,并且整体外径可小至6mm,未来有望实现低成本短交期小型化的行星滚柱丝杠量产交付。
触觉传感器需感知多维度数据完成复杂的自适应动作
现有人形机器人触觉传感器多只能实现单维度压力感知,我们认为仅实现单维度压力感知意义有限,需要实现多维度数据感知从而完成复杂的自适应动作。多数触觉传感器只能感受到平面的压力分布,应用较为局限,而人类的触觉可以感知到平面六维力、材质、滑动态滚动态等多维度信号,使人类能在更丰富多元的场景下更好地感知,完成复杂的自适应动作。目前能够实现多维度信号感知的触觉传感器技术路线可分为视触觉和电磁两大类。视触觉路线一般通过内置摄像头拍摄传感器表面形变推测力的大小、滑动态滚动态等多维度信号,代表厂家如Gelsight;电磁类可通过霍尔磁阻效应反推应力场,实现法向力、摩擦力、分布力、力矩、材质、温度、滑动、回弹等15种触觉信息的测量,代表厂家如帕西尼感知科技。
绳驱灵巧手方案需解决腱绳长期使用后的蠕变问题
特斯拉灵巧手已更新至第三代绳驱方案,我们认为高自由度与低成本是灵巧手长期发展方向,特斯拉绳驱需解决蠕变问题。特斯拉第一代灵巧手单手11个自由度,配备6个电机模组,采用电机直驱方案;第二代灵巧手自由度与电机模组没有变化,增加阵列式触觉传感器;第三代灵巧手单手自由度上升至22个,采用绳驱方案,电机数量大幅增长。相较于前几代将电机放置于手掌中,第三代模仿人体构造,将电机放置于小臂中,通过减速箱和微型丝杠等传动部件牵引腱绳实现手指的弯曲。第三代方案降低了对电机体积的要求,从而降低了电机成本,提高了自由度。但绳驱方案需解决长期使用的蠕变问题,目前产业解决方案有三类:1)通过传感器做自校准,但触觉传感器需长期保持高精度,并且传动结构设计时需要考虑冗余度;2)采用蠕变更少的高分子聚合材料绳子,成本高但能稍微延长寿命;3)参考汽车保养,定期更换。
机器人大模型技术进展不及预期:我们认为人形机器人是像机器的智能体,所以若机器人大模型进展不及预期,将会限制机器人智能化水平的发展,从而导致机器人放量不及预期。
量产化进度不及预期:若机器人智能化水平发展符合预期,但机器人量产化良率遇到瓶颈,同样会限制机器人量产。
零部件技术变革不及预期:机器人成本仍需降低,若机器人零部件技术变革低于预期将会延缓机器人成本降低的幅度。
VIP课程推荐
APP专享直播
热门推荐
收起24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)