【观点分享】【滴水研究】智能时代纪事:人形机器人产业研究(上篇)
一、引言
其实如果从我们“智能时代纪事”这个系列的整体逻辑来看,写到“人形机器人”是再合理不过的事情了——在这个系列之前的文章里有提到“...打算按照人类的工具史,从造四肢(机械和早期的电气结构),到造脑和造头(计算机、智能手机),再到将大脑、躯壳和四肢组装起来(各种机器人,自动驾驶,人形机器人等等);从人的动作的延伸(比如早期的刀、棍、锄头、推车等执行或纯机械类工具),到能够按照人类的指令来完成一些动作(动力自动化和电气化),再到有自己的判断和信息处理能力(AI),有知识和判断输出(ChatGPT),甚至是产生机器意识...”。
随着AI技术和产业发展,结合着机器人过往几十年的技术和产业化积淀,真正意义上的机器人——重点不再只是“人型的机器”——似乎逐步要走向台前,它不仅会像人一样行走,也会和人一样抓取,用手去感知,也可以和人聊天交流,也许未来的某一天,它突然产生了自己的机器意识,也不是不可能的了。
回想起最早筹划这个系列的初衷:“人类制造的究极目标,大概就是想像造物主一样,造一个自己出来。不管打开这个魔盒会放出来什么,我们都抵挡不了想要打开它的诱惑。” 历史的车轮滚滚向前,我相信我们正在全面走入一个真正的智能时代,而人形机器人,会是这个时代最重要的标志。
让我们还是先从人形机器人这个产业的发展历程说起....
基于AI生成
1、人形机器人产业发展历程
最早的人形机器人探索可以追溯到15世纪,达芬奇设计出的“机器武士”,可以算得上是人形机器人的“古早时期”。进入20世纪,随着电子技术的发展,人形机器人的探索也算正式拉开序幕,20世纪60年代开始结合计算机和早期人工智能的发展,机器人开始具备并不断完善感知和交互能力,进入21世纪后,尤其是自2010年以来人形机器人行业的发展开始持续加速,近年来结合AI技术和应用的不断突破,人形机器人的大规模商用和走进人类的生活,似乎也是“就在灯火阑珊处”了。
早期探索阶段(15世纪末-20世纪初):以机械结构和动力为主,实现简单动作
-
1495年:达芬奇设计出通过风能、水力驱动的"机器武士",可坐、站立、挥舞手臂
-
18世纪:出现了通过齿轮杠杆移动棋子下棋的"土耳其机器人",以及具有写字、绘图、演奏等功能的各类人形机器人
-
19世纪末-20世纪20年代:加拿大发明家设计出可行走机器人,美国西屋电器研制出"Televox"机器人
电子控制萌芽阶段(20世纪20-60年代):电子技术应用,机器人功能性增强
-
1928年:日本第一台人形机器人Gakutensoku诞生
-
1933年:美国Elektro机器人问世,引入电子控制
-
1939年:“电波机器人”发明,可接受无线电波指令实现行走
-
1963年:NASA研制出可模拟35种人类基本动作的机器人
人工智能融合阶段(20世纪60年代-21世纪初):计算机和人工智能技术发展,机器人开始具备感知交互能力
-
1967年:日本加藤一郎启动人形机器人项目,1972年研发出世界首款全尺寸智能人形机器人WABOT-1
-
1984年:WABOT-2问世,可识乐谱、演奏等,但自主能力有限
-
2000年:本田ASIMO推出,可完成跑跳等复杂运动,与人对话互动
-
21世纪初:NAO、PETMAN等教学、检测用途的人形机器人相继问世
高仿真自主化发展阶段(2010年代至今):机器人在运动、感知、交互等方面接近人类
-
2013年起:Atlas机器人不断改进,实现高难度体操动作,可在复杂环境活动
-
2016年:高度拟人的Sophia、Walker机器人,具备情绪表达和环境适应能力
-
2019年:定位物流的Digit双足机器人,实现商业化但规模尚小
-
2021年:面部表情丰富逼真的Ameca问世,对外界刺激有反应
-
2022年:特斯拉Optimus发布,在感知、记忆、操作等能力上趋于成熟,有望在生活和工业领域普及应用
-
2023年:特斯拉Optimus Gen-2 发布,相较前一代重量减轻了10公斤,平衡感和身体控制能力得到改善。
-
2024年:Figure01进入宝马工厂做标准化任务培训和执行,优必选Walker S进入蔚来工厂完成首次现场培训,执行装配辅助任务,智元机器人远征A1也在汽车工厂完成底盘装配、线束整理和外观质检等任务。
2、国内外人形机器人厂商及产品情况
近年来,越来越多的国内外人形机器人厂商浮出水面,推出了相关的产品。对此我们也做了一些梳理,如下面两张表所示:
部分国内外现有人形机器人厂商:
数据来源:各公司官网
部分国内外人形机器人参数对比:
数据来源:各公司官网、网络资料总结整理
人形机器人产业上的公司的融资行情也是一片红火,对此我们也简单梳理成表,如下所示。可以看出头部公司的估值和融资金额这两年都是快速增长。
部分人形机器人产业链公司的融资情况:
3、WAIC2024 - 展望未来
在2024年世界人工智能大会(WAIC 2024)上,汇聚了全球顶尖的AI企业、专家和学者,共同分享了AI发展的新思想、新发现和新机遇。人形机器人也是WAIC2024会上的热点,总结来看,未来人形机器人预计将在以下几个方面取得进一步发展:
-
人形机器人与人工智能的深度融合。如"青龙"人形机器人与书生大模型的结合,实现了机器人和AI的深度融合,展现出人形机器人在认知智能和社交交互方面的巨大潜力。
-
性能的不断提升。人形机器人在自由度、负载能力、行走速度、平衡控制等方面将持续改进。如特斯拉Optimus在步行速度和平衡控制上的进步,以及宇树H1创造了3.3m/s的最高速度,都标志着人形机器人运动能力的显著提升。
-
材料的升级换代。未来人形机器人将采用更轻量化、高强度的新材料,如达闼"小紫"采用碳纤维复合材料,实现了重量的进一步减轻。新材料的应用将有助于提高机器人的运动效率和耐久性。
-
智能化和交互能力的大幅增强。人形机器人将具备更强大的多模态感知交互能力,能完成更加精细和复杂的任务。它们有望在家庭服务、医疗护理、工业制造等领域得到广泛应用,为人类生活和生产带来便利。
-
商业化和产业化进程的加速。各大厂商将面向不同行业提供专用的人形机器人解决方案,推动其规模化生产和应用。如达闼、擎朗等企业推出了面向家庭和行业的商用人形机器人产品,标志着人形机器人产业化进程的提速。
-
安全性与伦理性。在人形机器人功能和智能不断增强的同时,其安全性、伦理性和法律法规建设也将成为业界关注的焦点。确保人形机器人在技术发展的同时,在伦理和安全方面的可控性,将是未来的一个重要课题。
基于AI生成
二、人形机器人产业链
1、人形机器人产业链总览
资料来源:滴水研究
以特斯拉Optimus为模板来进行拆解,很多的机构和第三方都进行了研究,按照价值量梳理,如下表所示:
数据来源:Goldman Sachs Global Investment Research,绿的谐波、步科股份、鸣志公司官网,滴水研究
(1)零部件构成及市场空间预测:
-
从上面的拆解表可以看出,行星滚珠丝杠(20.7%)、无框力矩电机(15.3%)、谐波减速器(10.1%)、位置传感器(9.2%)占比较高,是机器人的核心零部件。动力电池包、摄像头模组、外壳结构件等标准化程度较高的零部件占比相对较低。
-
当人形机器人销量达到百万级时,机器人总成的市场空间将超过千亿元。其中,线性关节总成、旋转关节总成的市场空间会超过500亿元,无框力矩电机、力矩传感器、行星滚柱丝杠、谐波减速器等核心零部件的市场空间将超过百亿。
(2)国产化替代能力及产业链发展机遇:
-
比较成熟:摄像头模组、位置传感器、编码器、无框力矩电机、空心杯电机、外壳结构件等,国内厂商具备较强的替代能力。
-
有待提升:对于谐波减速器、离合器、力学传感器等,国内厂商虽有一定基础,但在性能稳定性、批量生产能力上还有待提升。
-
相对薄弱:行星滚珠丝杠、六维力矩传感器是相对短板,目前国内较难实现完全的自主可控。另外在通用人工智能、运动控制、触觉传感器等关键核心技术上,国内还处于跟跑阶段,需要加大研发投入。
从人形机器人的结构来看,主要也是由感知系统、决策系统和执行系统这三大块构成,因此我们也分这三大类来进一步做些梳理。
2、感知系统(感官)
(1)感知系统产业链总览
资料来源:公开资料整理,滴水研究
对于人类而言,视觉可能解决了我们生活中大部分的感知,但其他的感知方式同样不可或缺,它们弥补了视觉的缺陷,使得我们的感知体系全面而可靠。对于机器人而言,过往许多的交互操作任务主要也是依靠视觉去实现,可能能做80%-90%,但如果真正想要让机器人具备“具身智能”,其他的感知方式也应该加入进来,这其中,触觉是重头戏,高性能的触觉能够帮助机器人完成对世界最后10%-20%的触达。
从产业链的情况来看,视觉传感器、IMU和位置传感器都比较成熟,这里也不过多说明。这里我们主要也是对触觉传感器进行一些梳理,主要对力/力矩传感器及柔性触觉传感器做下梳理。
-
力传感器按照测量维度可分为一至六维力传感器。其中六维力传感器(又称六维力矩传感器)能感知最全面的力觉信息,可以精确测量X、Y、Z 三个方向的力信息和三个维度的力矩信息。内部算法可解耦各方向力和力矩间的干扰,使力的测量更精准。据GGII预计,2027年中国六维力传感器市场规模将超15亿元,2022-2027年CAGR超45%。人形机器人的发展将为六维力传感器带来巨大的应用空间。
-
六维力传感器的技术壁垒:
-
结构设计需兼顾高灵敏度、高动态性能和低维间耦合,对创新能力要求高。
-
标定与检测对样本空间和数学模型要求高,六维联合加载标定是高精度传感器的必要条件。
-
算法设计要求能解耦各方向力矩干扰,实现高精度测量。
-
-
多维力传感器主要应用于高端需求场景,下游机器人领域客户进入壁垒较高。 目前,全球的力传感器厂商主要包括日韩、欧美、中国地区的供应商。韩国企业 Robotous、 Aidin Robotics 主要合作厂商包括 Doosan Robotics、Neuromeka 和 Rainbow Robotics;日本企业 Sintokogio 和 WACOH-TECH 主要合作厂商包括发那科、 电装、三菱、那智不二越、安川等。欧美地区六维力/力矩传感器厂商主要包括传统的传感器生产商,包括 ATI、AMTI、Kistler 等,以及全球知名的机器人末端工具生产商,主要有 SCHUNK、OnRobot、Robotiq 等。
-
国产六维力/力矩传感器与海外厂商传感器在灵敏度、串扰、抗过载能力及维间耦合误差等方面目前仍存在差距。但国内参与公司不断取得技术进展,宇立仪器(SRI)、坤维科技、鑫精诚、海伯森、蓝点触控、神源生智能、瑞尔特测控等, 均已有相关的产品落地并进入产业化应用。 多维力传感器单价相比于一维力传感器有大幅的提升,国内品牌产品单价显 著低于海外品牌。力传感器的单价随着产品技术难度的提升而显著提升,国内一维力传感器的单价大约在几十 - 几百元,六维力传感器在1-4万元,国外品牌的一维力传感器的单价在两千元左右,在六维力传感器单价在 5-10 万元。其实从六维传感器的技术发展来看,对国内玩家而言无明显卡脖子环节,核心还是工艺壁垒,中国厂商在中低端产品上已突破,产品性价比更高,后续这块国产化率可能也会快速提升。
(3)柔性触觉传感器
-
现如今,电子皮肤跟随着人形机器人概念也火热起来。电子皮肤是一种柔性的触觉方案,能够实现与环境接触力、温度、湿度、震动、材质、软硬等特性的检测。其关键技术包括:材料技术、加工技术、结构设计及扩展、高柔性和多功能。柔性触觉方案在智能系统、可穿戴设备、医疗等领域具有重要意义。根据智研咨询,2022年全球柔性触觉传感器市场规模为19.31亿美元。主要下游应用为医疗和消费电子领域。随着科技进步和应用拓展,市场规模呈逐年上涨趋势。
-
主要的技术壁垒:
-
高性能材料的选择与开发
-
先进加工技术如聚合物微机械加工、电子印刷、3D打印等的应用
-
兼顾高柔性和多功能的结构设计
-
保证测量精度的同时实现大面积柔性传感器的阵列化
-
-
从技术路线上来看,一是基于Mems技术集成的触觉传感器,包括压阻式、电容式、光电式、电磁式,二是视触觉传感器。
资料来源:东吴证券研究所
MEMS路线中,压阻式触觉传感器技术最成熟,目前应用最广,其采用MEMS技术排列密集,集成度高,体积小,技术成熟,成本低。
而视触觉传感器本质是基于视觉领域在AI方面的数据和大模型的积累,通过图像来提取需要的触觉数据。该技术方案第一步使用高精度相机拍摄可变柔性材料的形变,当受力时,网格形状发生形变,MEMS技术集成的微型双目相机记录该形变,再基于已训练好的深度学习大模型,映射出物体的深度信息和运动趋势。其理论上能够测量各种方向及不同分布位置的力信息,适用性广,在切向摩擦力与滑移等特性上的测量上限也更高,精确度高;同时原材料成本可控。目前这个方向也是学术和产业中大家研究的重点,国外比较领先的学校和公司是MIT和Gelsight,国内现在也有比较多的机构和公司在做这方面的研究和产业化。
3、决策系统(大、小脑) 产业链
(1)决策系统产业链总览
资料来源:公开资料整理,滴水研究
(2)芯片
当前,GPU凭借其强大的并行计算能力,在人工智能芯片领域一枝独秀。以英伟达为代表的GPU厂商在人形机器人的视觉、语音、决策等模块有着广泛应用。不过,GPU功耗较高,不太适合功率受限的边缘端场景。FPGA、ASIC等专用芯片以其低功耗、高性能的特点,在机器人控制器、传感器数据处理等领域大有可为。地平线、寒武纪等国产智能芯片正在异构计算、端云协同等方面发力。为了更高效地执行机器人专有算法,亚马逊、Qualcomm等巨头也在布局机器人专用架构(RPA)。未来,DPU、RPU等新型架构有望在人形机器人领域崭露头角。
这里我们以NVIDIA、Intel、Qualcomm和NXP在机器人这块的计算平台,分别从计算能力、功耗、AI加速、灵活性和应用场景这5个方面来进行对比:
资料来源:各家公司网站,滴水研究
2022年,ChatGPT、Stable Difussion等大模型的惊艳表现,让AI似乎一夜之间进入了"通用智能"时代。多模态大模型以其海量的知识储备、惊人的跨模态理解生成能力,有望成为人形机器人的"通用大脑"。OpenAI、Anthropic、DeepMind等大模型领军企业正在积极探索将语言模型与机器人学习结合的可能性。通过模仿学习、强化学习,让大模型学习机器人的状态-动作映射,直接输出对环境的操控指令。一些初创企业则采用更激进的"embodied AI"路线,即让大模型直接感知机器人的视觉、触觉等信息,端到端地控制机器人行为。如Figure机器人就搭载了OpenAI的ICM(反向动力学模型),实现了复杂的抓取、操作任务。国内商汤、百度等巨头也在抢占机器人大模型赛道。如商汤通过提示学习,使通用大模型学会对机器人发出自然语言指令。百度也发布了机器人专用的WenLan大模型,可实现场景理解、任务规划等功能。
这里我们以NVIDIA、Google和华为在机器人这块的大模型平台,分别从技术基础、模型特性、应用场景和生态建设这4个方面来进行对比:
资料来源:各家公司网站,滴水研究
(4)机器人操作系统
如果说机器人是智能时代的硬件标配,那么ROS就是机器人界的"Android系统"。它犹如一位优秀的"管家",将机器人的感知、控制、规划等模块有机地串联起来,让它们协同工作。ROS是连接机器人软硬件的关键中间件,负责感知、控制、规划等模块的调度与协同。ROS已成为学术界事实上的标准,拥有丰富的算法库和工具生态。ROS2作为ROS的下一代版本,具备实时性、安全性更高的特点。微软、亚马逊、英特尔等巨头也加入了ROS2的阵营,未来有望成为工业级机器人操作系统的主流。国内也有一些公司在ROS开发上进行布局。上海硅步机器人于2010年进入机器人科教领域,将开源机器人操作系统ROS技术引入中国,是第一个把ROS技术引入中国的公司。2015年11月,图灵机器人发布了他们的人工智能机器人专属操作系统Turing OS,依靠其背后运行的思维强化引擎、情感计算引擎以及自学习引擎,提升机器人的多模态交互能力。
(5)机器人AI算法
近年来,深度学习可谓机器人领域的"新宠"。在视觉感知方面,YOLO、Mask RCNN 等经典算法让机器人"火眼金睛",精准识别和定位目标。PointNet++、VoteNet则赋予机器人处理三维点云的能力。ORB-SLAM、VINS这类SLAM算法,更是机器人同步定位、构建地图的利器。在视觉感知方面,2D目标检测与分割经典算法如YOLO、Mask RCNN等已成熟应用于机器人抓取场景。点云语义理解则采用PointNet++、VoteNet等专用网络。视觉SLAM如ORB-SLAM、VINS也让机器人具备了同步定位与建图能力。在运动规划与控制领域,深度强化学习获得了广泛关注。TRPO、PPO等策略梯度算法可以学习连续空间的控制策略。PlaNet、Dreamer等模型预测算法则可端到端学习隐空间规划。模仿学习如BC、GAIL利用人类示教数据指导机器人行为。随着Transformer等新范式被引入,机器人有望掌握更高层的认知推理和任务规划能力。多模态信息的融合利用,也将使人机交互更加自然顺畅。未来,端到端学习将打通感知、规划、控制的壁垒,让机器人更加接近于人类的思维方式,成为名副其实的"通用智能"。总的来说,AI算法与机器人学、控制论的交叉融合,将是人形机器人智能化的重要方向。端到端感知规划、认知推理决策、多模态语言控制,将使未来机器人更加通用自主。
(6)NVIDIA在机器人方面的解决方案
NVIDIA 创始人兼首席执行官黄仁勋在 CadenceLIVE 2024大会表示,人类将构建“人形机器人”时代,持续看好生成式 AI 和人形机器人的发展。在2023年,NVIDIA 创始人兼首席执行官黄仁勋表示具身智能是 AI 下一个浪潮,机器人产品技术开始演进升级为 NVIDIA 的核心方向,2024年初,NVIDIA投资人形机器人公司FigureAI并成立通用具身智能体研究实验室GEAR,表示了对于该领域的持续看好。从机器人原理层面,NVIDIA正为机器人提供“大脑”技术,能快速提升机器人的智能水平,打开下游应用市场。
NVIDIA 为各行业提供开发平台和工具,自上而下促进人形机器人技术发展。从机器人原理的层面来看,NVIDIA正致力于为机器人提供“大脑”级别的技术,通过其强大的AI计算平台和先进的深度学习算法,能够显著提升机器人的智能水平,从而打开下游应用市场的广阔前景。NVIDIA的Jetson系列边缘AI超级计算机,如Jetson AGX Orin和最新的Jetson Thor,为机器人提供了前所未有的计算能力,支持复杂的AI模型运行,实现从感知、理解到决策的全面智能化。NVIDIA的Isaac SDK和Isaac Sim平台,为机器人开发者提供了从仿真到部署的完整工具链,加速了AI模型的训练和优化,降低了开发门槛,促进了人形机器人技术的快速迭代和创新。主要的产品梳理如下:
-
通用基础模型 Project GR00T
-
技术亮点:GR00T 是 NVIDIA GEAR 实验室推出的首款用于人形机器人的通用基础模型,通过 NVIDIA GPU加速仿真训练,使机器人能从少量人类演示中学习,根据视频数据生成动作,接受多模态指令。GR00T 模型使用 Isaac 工具(如 Isaac Lab 和 OSMO)构建和测试基础模型。
-
Isaac Lab 用于大规模训练人形机器人模型。
-
OSMO 是一个管理训练和仿真工作负载的云工作流编排平台,可在分布式环境中扩展工作负载。对于具有复杂的多阶段和多容器工作流的机器人工作负载,该平台提供与位置无关的部署选项,并为已部署的模型提供数据集管理和可追溯性功能。
-
-
应用案例:GR00T 驱动的人形机器人在 Agility Robotics、Apptronik、傅里叶智能和宇树科技等四家公司的人形机器人上进行了展示,展现了其在多模态指令接受和动作生成方面的潜力。
-
工作原理:
-
资料来源:Nvidia网站
-
计算平台 Jetson Thor
-
技术亮点:Jetson Thor基于NVIDIA Blackwell架构,集成GPU、功能安全处理器、高性能CPU集群和100GB以太网带宽,提供每秒800万亿次8位浮点运算AI性能,简化人形机器人设计和集成工作。Jetson Thor 的强大算力和集成特性,使其成为人形机器人计算需求的理想选择。凭借集成的功能安全处理器、高性能 CPU 集群和 100GB 以太网带宽,Jetson Thor 将显著简化人形机器人设计和集成工作,能够帮助人形机器人执行复杂的任务并安全、自然地与人和机器交互,具有针对性能、功耗和尺寸优化的模块化架构。
-
应用领域:Jetson Thor能够执行复杂任务,与人和机器安全、自然地交互,适用于人形机器人计算需求,为机器人提供强大的边缘计算能力。
-
-
预训练模型 Isaac Manipulator
-
技术亮点:Isaac Manipulator 作为一个预训练模型,聚焦训练动态操纵任务,能为机械臂开发提供卓越的灵活性和模块化 AI 功能,并提供了一系列强大的基础模型和 GPU 加速库,能帮助开发者简化端到端工作流,以更高效率和更低错误率来训练机器人模型,提供高达80倍的路径规划加速,使开发者能够自动执行更多新的机器人任务。Isaac Manipulator 适用于机械臂开发,通过加速AI模型训练和任务编程,构建可扩展和可重复的工作流。该项目早期的生态系统合作伙伴包括安川、优傲机器人、PickNik Robotics、Solomon、READY Robotics 和 Franka Robotics。机器人开发者可以使用专门为特定任务定制的软件组件组合来感知周围环境并与之交互,通过加速 AI 模型训练和任务编程,为动态操纵任务构建可扩展和可重复的工作流。
-
应用领域:Isaac Manipulator 适用于机械臂开发,通过加速AI模型训练和任务编程,构建可扩展和可重复的工作流,为机械臂开发提供卓越的灵活性和模块化AI功能。
-
工作原理:
-
资料来源:Nvidia网站
-
FoundationPose 是一个开创性的基础模型,用于对以前未见过的物体进行 6D 姿势估计和追踪。
资料来源:Nvidia网站
-
cuMotion 利用NVIDIA GPU的并行处理能力,通过同时运行多个轨迹优化来提供最佳解决方案,从而解决工业规模的机器人运动规划问题。
-
FoundationGrasp 是一种基于 transformer的模型,可对未知 3D 物体进行密集抓取预测。
-
SyntheticaDETR 是一种适用于室内环境的对象检测模型,可加快新对象的检测、渲染和训练速度。
-
视觉AI工具 Isaac Perceptor
-
技术亮点:Isaac Perceptor提供多摄像头和3D环绕视觉功能,提升机器人的感知力和空间层次感,适用于制造业和物流业中的自主移动机器人,提高效率和工人安全,降低错误率和成本。Isaac Perceptor适用于多摄像头360度视觉功能,为机器人企业带来先进的视觉AI支撑,加快产品部署。随着视觉传感器的使用,基于视觉的功能正越来越多地用于制造和履行操作中采用的自主移动机器人和人形机器人,以提高效率和工人安全,并降低错误率和成本。Isaac Perceptor早期采用者包括 ArcBest、比亚迪和凯傲集团,目前 NVIDIA 正计划扩大其适用范围。Isaac Perceptor以每秒 30 Hz 的刷新率处理 16.5 M 深度点。立体差异通过来自立体摄像头的时间同步图像对计算得出,用于为场景生成深度图像或点云。高效的半监督式深度神经网络 (ESS DNN) 为基于深度神经网络的立体差异提供了 GPU 加速支持。
-
资料来源:Nvidia网站
-
应用领域:Isaac Perceptor 适用于多摄像头360度视觉功能,为机器人企业带来先进的视觉AI支撑,加快产品部署,提升机器人在复杂环境下的感知和交互能力。
-
虚拟仿真工具 Isaac Lab
-
技术亮点:Isaac Lab 是一个GPU加速、性能优化的轻量级应用,基于Isaac Sim构建,用于运行数千个用于机器人学习的并行仿真,支持大规模学习所需的仿真基础设施及合成数据流水线。Isaac Lab 用于模拟机器人学习技能,支持数千个机器人同步训练模拟,配合 Isaac Lab,能为智能体的学习过程提供有力支持。国内人形机器人厂商傅利叶、小鹏等也参与该平台合作,并展出了机器人图像,在移动机器人领域,Isaac Manipulator 和 Isaac Perceptor 将共同降低 3D 感知成本,多传感器栈的每个AMR会处理来自六个传感器的视觉信息,而所有信息都会在数字孪生中进行仿真,保证最终动作执行的可靠性。
-
应用领域:Isaac Lab 用于模拟机器人学习技能,支持数千个机器人同步训练模拟,配合 Isaac Lab,能为智能体的学习过程提供有力支持,加速机器人AI模型的训练和优化。
-
-
生态合作与产品体系
-
生态合作:NVIDIA 与多家领先的人形机器人公司合作,构建全面的AI平台,包括1X Technologies、Agility Robotics、Apptronik、Boston Dynamics、Figure AI等。这些合作不仅推动了技术的创新,还促进了机器人产业的快速发展。
-
产品体系:NVIDIA 的机器人技术体系包括多模态基础模型、数据集获取、硬件和AI开发平台,以及生态合作,形成模型+软件(平台)+硬件(算力)一体化系统,推动机器人产业进入载体快速发展阶段。
-
-
AI Gym与集成应用
-
AI Gym:NVIDIA软件(Omniverse、Metropolis、Isaac和cuOpt)共同打造了一个AI Gym,让机器人和AI智能体能够在复杂的工业领域中进行训练并接受评估。AI Gym提供了一个全面的环境,用于测试和优化机器人的性能。
-
NVIDIA Omniverse 是一个开放的3D设计协作和模拟平台,旨在为艺术家、设计师和工程师提供一个共享的虚拟工作空间,以创建、编辑和模拟复杂的3D场景和模型。Omniverse 支持跨多个3D应用程序的实时协作和数据互操作性,利用NVIDIA RTX技术提供实时的光线追踪渲染和物理模拟。
-
NVIDIA Metropolis 是一个用于构建智能视频分析应用的平台,它结合了 NVIDIA GPU的强大计算能力、深度学习算法和一系列工具,用于实时视频分析、目标检测、行为识别等。Metropolis 支持从边缘设备到数据中心的部署,适用于智慧城市、零售、安全监控等多个领域。
-
NVIDIA Isaac 是一个机器人开发平台,提供了一系列工具和库,用于加速机器人的感知、规划和控制。Isaac 包括用于机器人学习的仿真环境、AI 模型、加速库和参考硬件,支持从开发到部署的整个机器人开发流程。
-
NVIDIA cuOpt 是一个基于GPU的优化引擎,用于解决复杂的优化问题,如路径规划、调度和资源分配。cuOpt利用NVIDIA GPU的并行计算能力,能够快速求解大规模优化问题,适用于物流、交通、供应链管理等领域。
-
-
集成应用:NVIDIA 的技术在仓库、工厂、仓库和配送中心等场景中集成应用,提高工作效率,保障人类同事安全,使机器人成为执行重复性或超精密任务的智能助手。例如,Isaac Perceptor和Isaac Manipulator在物流和制造领域的应用,展示了NVIDIA技术在实际场景中的价值。
-
4、执行系统(肢体)产业链
(1)执行系统产业链总览
资料来源:公开资料整理,滴水研究
不同结构型号的执行器之间的对比如下表所示:
资料来源:公开资料整理,滴水研究
相对而言,国内公司在执行器产业链上还是比较有优势,整体的成熟度较高。这里我们对其中国产化能力比较薄弱的减速器、丝杠和电机做一个梳理。
减速器是连接电机和负载的中间装置,用于降低电机的输出转速。通常一个电机的转速可达数千转每分钟,而输出扭矩较小,无法满足大部分负载端低转速大负载的工作需求,因此无法直接与输出端相连。减速器分为伺服(精密控制)用减速器和一般传动减速器。 精密减速器具备体积小、重量轻、精度高、稳定性强等特点,能够对机械传动实现精准控制,主要用于机器人、新能源设备、高端机床、电子设备、印刷机械等 高端制造领域。其中机器人领域主要应用的精密减速器包括谐波减速器、RV减速器、精密行星减速器。
资料来源:科峰智能招股说明书,滴水研究
人形机器人关节减速器以谐波减速器为主、精密行星减速器为辅。现有人形机器人产品如特斯拉Optimus、优必选Walker、智元远征A1采用谐波减速器。谐波减速器由于具有体积小、精度高、传动比大的特点,因此是目前 人形机器人领域的主流方案。但人形机器人由于在行走时往往腿部关节将承受巨大的冲击荷载,因此采用抗冲击性能较差的谐波减速器存在损坏风险。随着半直驱驱动器的不断发展,未来精密行星减速器可能会被用在部分易受冲击的关节(如膝盖、腿部)中。
资料来源:公开资料整理,滴水研究
-
谐波减速器:
谐波减速器由波发生器、柔轮和刚轮组成。其工作原理通常采用波发生器主动、 刚轮固定、柔轮输出形式,当波发生器装入柔轮内圆时,迫使柔轮产生弹性变形而呈椭圆状,使其长轴处柔轮齿轮插入刚轮的轮齿槽内,成为完全啮合状态;而其短轴处两轮轮齿完全不接触,处于脱开状态,当波发生器连续转动时,迫使柔轮不断产生变形并产生了错齿运动,从而实现波发生器与柔轮的运动传递。 谐波减速器具有单级传动比大、体积小、质量小、运动精度高并能在密闭空间和 介质辐射的工况下正常工作的优点。且与一般减速器比较,在输出力矩相同时, 谐波减速器的体积可减少2/3,重量可减轻 1/2。因此谐波减速器被广泛运用于3C、半导体、食品、注塑、模具、医疗等需要较高传动精度的场景。在机器人领域,谐波减速器主要应用于小臂、腕部、手部等部件。
根据头豹研究院数据,2016-2020年我国谐 波减速器市场规模由9.5 亿元增长至19.3 亿元,CAGR 为19.4%;预计2025年我国谐波减速器市场规模将达41.0亿元,2021-2025年CAGR为17.2%。我国机器人用谐波减速器市场规模未来将进入高速发展阶段。根据华经产业研究院数据,2017-2021年我国机器人用谐波减速器市场规模由8.6亿元增长至12.1亿元,CAGR为 8.9%;预计2025 年我国机器人用谐波减速器市场规模将达 30.0亿元,2022-2025年CAGR为 23.6%。
-
RV 减速器:
根据QY Research数据,2016-2020年全球RV减速器市场规模由8.0亿元增长至8.6亿美元,CAGR为1.7%;预计2021-2027年全球RV减速器市场规模将由9.82亿美元增长至15.35亿美元,CAGR为7.7%。国内市场规模方面,根据华经产业研究院数据,2014-2021年我国RV减速器市场规模由10.8 亿元增长至43.0亿元,CAGR为21.8%,市场规模增速显著高于全球整体水平。
-
精密行星减速器:
精密行星减速器主要由行星齿轮、行星架和太阳轮构成。每台精密行星减速器都会有多个行星轮,它们会在输入轴和太阳轮旋转驱动下,同时围绕太阳轮旋转, 共同输出动力,带动负载运动。太阳轮和齿圈存在齿数差,从而达到减速目的。
根据QY Research数据,2018-2022年全球精密行星减速器市场规模由9.0亿美元增长至12.0亿美元, CAGR为7.4%;预计 2023-2029年全球精密行星减速器市场规模将由12.6亿美元增长至22.3亿美元,CAGR为10.1%。国内市场方面,根据QY Research数据,2018-2022年我国精密行星减速器市场规模由3.0亿美元增长至5.0亿美元,CAGR为14.0%;预计2023-2029年中国精密行星减速器市场规模将由5.2 亿美元增长至11.5亿美元,CAGR为 14.1%。
(3)丝杠
丝杠是一种将旋转运动转化为直线运动的机械零部件,广泛应用于数控机床、工业机器人、3C电子设备、医疗器械等领域。丝杠的性能对设备的定位精度、传动效率、使用寿命等有决定性影响。设备与工艺为滚柱丝杠核心壁垒,良率和效率是滚柱丝杠需突破的重点。
-
主要分类
资料来源:《滚珠丝杠传动使用与发展》,《行星滚柱丝杠螺纹的硬态车削加工技术研究》,山东博特官网,南京工艺官网,国海证券研究所
-
一般工艺流程
资料来源:《滚珠丝杠传动使用与发展》,《精密滚珠丝杆机械加工工艺规程研究》
-
螺纹加工工艺对比
资料来源:王伟《大型螺纹旋风硬铣削数值模拟及工艺参数优化》
-
市场规模
当前,全球丝杠市场需求旺盛,中国已成为最大的消费市场。据统计,2020年全球丝杠市场规模超过130亿元,其中中国市场约40亿元,占比30%左右。"十四五"期间,在智能制造快速发展、产业升级的大趋势下,中国丝杠市场有望保持10%以上的年均增速。就竞争格局而言,欧美、日本企业占据了全球70%以上的市场份额,技术水平全球领先。代表企业有舍弗勒控股的瑞士GSA、德国Bosch Rexroth、日本NSK、THK等。中国企业起步较晚,经过多年的技术积累,在中低端市场占据优势,部分企业在高端领域实现突破,与国际巨头展开正面竞争。代表企业有艾迪精密、上银科技、润星科技、新剑传动等。
-
滚珠丝杠应用广泛,技术成熟,市场空间超百亿。滚珠丝杠22年市场空间18-19亿美元,合计人民币130亿+,其 中国内市场30亿左右。格局看,日本和欧洲滚珠丝杠企业占据了全球约70%的市场份额,前三大为日本的NSK、 THK、中国台湾的上银。国内厂商主要生产偏低端产品,格局较为分散,CR5份额为46%,其余份额为54%。
-
滚柱丝杠壁垒高,目前市场需求量小。与滚珠丝杠这类型成熟产品不同,滚柱丝杠目前应用领域小,23年全年市 场空间预计不足10亿元,按照单价2万,年需求仅5万套。
-
国内厂商加大滚柱丝杠研发与布局。在滚珠丝杠和滚柱丝杠市场中,各公司展现了不同的竞争优势。新剑传动和秦川机床拥有大规模生产能力和广泛的应用领域。鼎智科技专注于小尺寸高精度产品和创新技术。贝斯特和恒立液压通过高额投资引进先进设备,提升了高端产品的生产能力。北特科技、五洲新春和斯菱股份则利用其在汽车零部件领域的经验,逐步进入滚珠丝杠市场。这些公司通过技术积累、产能扩张、精密加工能力和市场定位等方面的努力,正在这个竞争激烈的市场中寻求各自的发展机会。
-
主要技术壁垒
-
行星滚柱丝杠精度要求高,加工工艺壁垒深厚
-
丝杠螺距误差是产生误差最主要因素,对螺纹加工工艺要求高
-
螺纹磨削精度高,生产效率低,目前螺纹磨床精度已跟上,但核心数控系统仍采用国外产品
-
生产效率和良率,是滚柱丝杠未来降本的关键所在。
-
电机的作用是根据所接收的力矩、速度、位置等指 令信号,带动机械部件实现特定运动。同时电机中的多种传感器,如编码器、力传感器 等,还会将电机与机械部件的实时运作信息反馈给驱动器和控制器,从而完成精准运动 控制。 根据控制方式的不同可以分为步进电机、伺服电机和力矩电机,机器人对运动精准度要求,所以主要采用伺服电机或力矩电机。
资料来源:公开资料整理,滴水研究
在旋转关节、线性关节、机械手等,微特电机(一般指直径小于160mm或额定功率小于750W的电机)有望在人形机器人上大规模应用。由于机器人要求控制精度高、工作环境复杂、结构紧凑,因此对电机提出较高技术要求。
-
转矩惯量比要大,机电时间常数要小,以满足系统快速反应的要求
-
调速范围宽,低转速运行平稳 ,零速附近可控,力矩波动要小,以满足各种运 动速度和精确定的要求
-
功率体积比和功率重量比要大,以满足有限安装空间,即要求微电机尽量做到 小型化和轻量化
-
过载能力大,耐热性能好,在恶劣环境条件能长期工作,即具有良好耐环境性 和高可靠性。
-
市场规模
受益于需求扩张,我国伺服电机市场保持稳健增长。根据中商产业研究院数据,2022年我国伺服电机市场规模181亿元,同比增长 7.1%。我国伺服电机市场由外资主导, 外资品牌占比65%。国产品牌汇川技术市场份额占比排名第一,市占率15.9%。安川、 台达、松下及三菱,占比分别为11.9%、8.9%、8.8%及 8.3%。
人形机器人有望带动力矩电机市场规模快速增长。根据海外市场研究公司Technavio 数据,2023年全球力矩电机市场规模增长 6.95%至 6.57亿美元,市场空间较小。未来随 着人形机器人逐步放量,无框力矩电机市场规模有望快速增长。若以2030年人形机器人出货量达100万台,同时无框力矩电机产品单价下降一半到500元/台来估算,预计人形机器人领域无框力矩电机市场空间将达到23.97亿美元,叠加传统领域市场空间的 平稳增长,总市场规模有望达到33亿美元。
-
技术壁垒
-
无框力矩电机
-
高精度制造工艺:确保转子和定子之间的间隙及同心度
-
热管理:设计合理的散热系统以有效管理热量
-
驱动控制系统:精密的驱动和控制系统实现高效运转
-
-
空心杯电机
-
精密绕线技术:无铁芯设计要求精密的绕线技术确保线圈密度和均匀性
-
动平衡:轻薄转子的动平衡在高速旋转时是关键技术难点
-
热管理:设计的散热方案防止过热
-
驱动控制系统:高精度的驱动和控制系统实现精密速度和位置控制
-
-
-
关注企业
-
鸣志电器:具备现场总线技术和系统集成能力,空心杯无齿槽电机业务增长显著。
-
鼎智科技:掌握减速箱核心技术和自研空心杯电机绕线设备,实现全自动批量生产。
-
伟创电气:提供高转速、高扭矩、低噪音的空心杯电机,进入机器人产业链。
-
步科股份:无框力矩电机性能和价格优势显著,扩展产能以满足市场需求。
-
昊志机电:无框力矩电机具有高性能、轻量化和长寿命,适用于高精度控制。
-
禾川科技:X6MN微型伺服电机适用于仿人机器人自适应手指关节,在机器人行业有丰富技术积累。
-
人形机器人灵巧手是一种高度拟人化的机器人末端执行器,旨在模仿人手的结构和功能,实现灵活、精细的操作和交互。手之于人体而言重要性不言而喻,我们和周围环境很大一部分的交互都是由手来完成,手对于环境和物体的感知是人类智能中非常重要的一部分,因此灵巧手对于机器智能而言也有着非常核心的地位。
基于AI生成
自20世纪70年代概念形成以来,灵巧手的研究与发展经历了早期探索、多指多自由度、体积减小与集成度提高、智能化与灵巧操作水平提升等几个重要阶段。在这一过程中,灵巧手的设计制造与控制技术不断进步,从最初的简单结构和有限功能,发展到如今的高度集成化和智能化。然而,实现灵巧手的高性能和广泛应用仍然面临诸多技术挑战,其中关键零部件技术是核心难点之一。
-
早期的机器人末端执行器以简单的两指机构为主,用以抓取和搬运特定的工件。它们大多采用气动或液压驱动,机械连杆传动,结构简洁,动作单一,只能完成预先设定的夹持动作。这类装置的优点是结构简单,成本低廉,运动可靠,已经能够满足早期工业流水线的需求。
-
为满足应用领域的拓展,人们对灵活性和多功能性提出了更高的要求于是出现了各种多指灵巧手的结构形式。例如三指、四指乃至五指的设计,每个手指也从单关节发展到多关节。欧洲、美国、日本等发达国家的研究机构纷纷投入多指灵巧手的研制。
资料来源:公开资料整理,滴水研究
-
关键技术:
-
仿生结构设计:从机械铰链到腱绳驱动再到软体结构,力求在灵活性、柔顺性和输出力之间平衡
-
驱动技术:从传统的电机、气压到新兴的人工肌肉、智能材料,需要在力矩、带宽、体积等性能间权衡
-
传动方式:齿轮、连杆传动逐渐被淘汰,腱绳传动成主流并衍生出柔性扭转腱绳等新方式
-
感知技术:除位置、速度等内部感知,对力、触觉等外部感知需求强烈,电子皮肤成为新的研究热点
-
复合/智能材料:软体、柔性关节设计对材料提出更高要求,驱动、传感与材料一体化设计成为趋势
-
建模与控制:复杂柔顺结构的建模及人手操控规律的数学表达极具挑战,机器学习方法可能是新的突破口
-
-
传动系统:不同的传动方式的对比如下表所示:
资料来源:公开资料整理,滴水研究
-
传感器:过往的机械手有一定的感知能力,但相较于人手的感知能力而言,只是九牛一毛。灵巧手要实现更加丰富的能力,就需要有更加强大的感知系统,因此其所需要的传感器也更加丰富。
-
内部传感器
-
力/力矩传感器:前文中对于力/力矩传感器已经有比较系统的介绍,在灵巧手中这部分主要有:
-
关节扭矩传感器:提供关节处的实时扭矩信息,是灵巧手稳定灵活操作的必要条件。如DLR Hand II每个手指配备了3个基于应变计的关节力矩传感器。
-
腱绳张力传感器:用于测量腱传动灵巧手的肌腱张力,常用方法有串联/包覆弹性体、偏置引导轮等。Robonaut 2 hand采用弹性体,UBH-IV hand采用窄视角光电元件测量腱张力引起的微小变形。
-
-
动作传感器
-
位置传感器:布置在驱动器末端,通过检测输出端角度间接获得关节角度,实现位置闭环控制。常见类型有电位计式、编码器、磁敏传感器等。如Robonaut2 Hand使用磁钢+霍尔元件,UBH-IV hand使用LED+光电二极管的光学式关节角度传感器。
-
弯曲传感器:用于腱传动灵巧手,感应腱绳位移随套管形状变化而产生的位置误差,配合张力传感器提高控制精度。
-
-
-
外部传感器
-
触觉传感器:同力/力矩传感器一样,上文中对触觉传感器也有比较详细的介绍了。从灵巧手的应用和功能需求的角度看,其所用的触觉传感器经历了三个发展阶段:
一些典型的多模态触觉传感器如Biotac(测量接触位置、温度、粗糙度等)和GelSight(测量形状、纹理等),代表了未来触觉传感器的发展趋势。此外,将视觉与触觉相结合的OmniTact传感器也是一个有益的尝试。
-
早期主要测量指尖力,对接触位置检测不可靠;
-
多阵列传感器可同时感知力与位置,但只能感知单模态信息;
-
当前发展方向是多模态传感器(如光学式)和多区域感知(如电子皮肤)。
-
-
接近传感器:接近传感器用于在抓取或操纵前感知物体与机器人手的相对位置,有助于估计物体的位置、形状等信息,提高操作成功率。典型的接近传感器由一对光纤组成,利用反射光强度测量与物体的距离。如腾讯灵巧手TRX-Hand在掌心处安装了微型激光雷达和接近传感器,用于在线调整抓取策略。
-
-未完待续-
参考资料:
-
Global AutomationHumanoid Robot: The AI accelerant, 2024, Goldman Sachs
-
https://www.eet-china.com/mp/a332563.html
-
https://www.leaderobot.com/news/4472
-
https://electrek.co/2024/03/27/elon-musk-tesla-optimus-robot-cost-less-than-half-car/
-
https://www.jiqizhixin.com/articles/2023-12-13-11
-
https://www.sznews.com/news/content/2024-08/05/content_31128680.htm?prolongation=1
-
https://wallstreetcn.com/articles/3710427