引言:四足机器人正在走出实验室
2026年,四足机器人行业迎来了一个标志性转折点——宇树科技的B2机器狗售价降至9.9万元人民币,首次将四足机器人的价格拉入了中小企业的可承受区间。与此同时,小米CyberDog 2、可以科技的Loona等消费级产品不断涌现,四足机器人正从军事侦察和工业巡检的”硬核”场景,加速走向家庭陪伴、教育和娱乐。
但四足机器人从实验室到家庭,远不止”降价”这么简单。它涉及运动控制、环境感知、人机交互等数十个技术领域的交叉突破。本文将从硬件架构、核心算法、感知系统和产业趋势四个维度,深入解析四足机器人的技术全貌。
一、硬件架构:高性能主控是刚需
1.1 主控芯片:算力决定天花板
四足机器人的主控芯片选择,直接决定了整机的运动控制能力和智能化上限。与扫地机器人这类低速轮式机器人不同,四足机器人在行走过程中需要实时计算12个关节(每条腿3个自由度)的力矩分配,同时还要处理IMU姿态反馈、足端力传感数据和视觉SLAM信息,这对芯片的算力要求极高。
当前主流方案对比:
| 芯片平台 | 算力(NPU/CPU) | 典型应用 | 特点 |
|---|---|---|---|
| RK3588 | 6 TOPS NPU + 4xA76 | 宇树B2、教育机器人 | 国产方案,性价比高,生态完善 |
| NVIDIA Jetson Orin Nano | 40 TOPS | 波士顿动力Spot、科研平台 | 算力最强,但功耗高(15-25W)、成本高 |
| STM32H7 + 外挂FPGA | 480MHz + 并行加速 | 小米CyberDog 2 | 低功耗、实时性好,但AI能力有限 |
| 全志T507 + 协处理器 | 1.5GHz A7 | 低端教育/玩具四足 | 成本最低,仅适合简单步态 |
值得注意的是,消费级四足机器人的算力需求正在快速上升。早期的教育机器狗只需要执行预设步态,一颗STM32就足够;但如今用户期望机器狗能自主避障、跟随主人、识别指令,这就需要NPU来运行视觉识别模型。RK3588凭借6 TOPS的NPU算力和成熟的国产供应链,已成为2025-2026年消费级四足机器人的首选方案。
1.2 执行器:四足机器人的”肌肉”
关节执行器是四足机器人的核心硬件。目前主流方案分为两类:
准直驱(Quasi-Direct Drive, QDD)执行器:这是宇树科技开创的技术路线。传统减速方案(如行星减速器+电机)虽然扭矩大,但反向驱动性差——外力很难让关节被动运动,导致机器狗走路僵硬。QDD方案采用高扭矩密度无框电机+小减速比谐波减速器,兼顾了大扭矩和高反向驱动性,让步态更加自然流畅。
串级弹性执行器(SEA):在电机和关节之间增加弹性元件(弹簧或弹性联轴器),可以存储和释放能量,提高能量效率。MIT Cheetah的早期版本就采用了SEA方案,在奔跑时能显著降低峰值功率需求。但SEA的缺点是控制带宽受限,不适用于需要快速响应的场景。
1.3 传感器配置
一台成熟的四足机器人通常搭载以下传感器:
- IMU(惯性测量单元):检测机身姿态,频率通常≥500Hz,是平衡控制的基础
- 足端力传感器:检测每条腿的着地状态和地面反力,实现柔顺控制
- 3D LiDAR或深度相机:用于地形识别和SLAM建图
- 双目/RGB-D相机:用于目标识别、人脸识别和导航
- 超声波传感器:近距离避障辅助
二、运动控制:让四条腿”跑”起来
2.1 步态规划:从对角 Trot 到自由步态
四足机器人的步态(Gait)决定了它的移动方式。常见的步态包括:
- Walk步态:一次只有一条腿离地,速度最慢但稳定性最高,适合复杂地形
- Trot步态:对角线两条腿同时摆动(前左+后右),是最常用的中速步态,兼顾速度和稳定性
- Pace步态:同侧两条腿同时摆动,稳定性较差但转弯灵活
- Bound步态:前两腿+后两腿交替,适合加速冲刺
- 自由步态:基于地形实时调整每条腿的摆动时机,适应不平地面,算法复杂度最高
2.2 核心控制算法
全身动力学控制(WBC)是目前四足机器人运动控制的标杆方案。其核心思想是将四足机器人的运动问题建模为一个优化问题:
在每一时刻,控制器根据当前状态(IMU数据、关节角度、足端力),求解一个二次规划(QP)问题,输出12个关节的期望力矩。优化目标通常包括:质心加速度跟踪、角动量最小化、足端力在摩擦锥内、关节力矩和速度不超限等。
麻省理工学院的工作证明了WBC可以让四足机器人在不平地面上实现动态稳定行走,甚至在被外力推搡时也能快速恢复平衡。宇树科技的商业化产品也采用了类似的控制架构。
模型预测控制(MPC)是WBC的上层规划器。MPC在固定的时间窗口内预测机器人的运动轨迹,提前规划质心位置和足端落点。通常MPC运行在50-100Hz,WBC运行在500-1000Hz,两者形成”慢规划+快跟踪”的层级结构。
2.3 平衡恢复:不倒翁的秘密
当四足机器人受到外部扰动(被踢一脚、走上一块倾斜的踏板)时,平衡恢复的关键在于”质心-支撑多边形”的关系。如果质心的投影落在四条腿构成的多边形内部,机器人就是稳定的;一旦质心偏出,就需要调整步态来扩大支撑区域。
先进的控制器(如Centroidal MPC)能在一帧内计算出最优的”恢复步”——哪条腿该抬起、往哪放,从而将质心重新拉回支撑多边形内。这就是为什么宇树B2在被推倒后能自己爬起来的原因。
三、感知与导航:看得见,走得稳
3.1 SLAM建图与定位
要让四足机器人在室内自由行走,首先需要建立环境地图并定位自身。主流方案:
- 2D LiDAR + 激光SLAM:成本适中,精度高,适合结构化室内环境。经典算法如Cartographer、Karto已被广泛商用
- 3D LiDAR + 点云SLAM:适合户外和复杂地形,但传感器成本高(单颗Velodyne VLP-16约3万元)
- 视觉SLAM(V-SLAM):仅用摄像头,成本低但精度受光照影响大。ORB-SLAM3是当前最成熟的视觉+惯性SLAM方案
- LiDAR+视觉融合:结合两者优势,是目前高端产品的标配方案
3.2 路径规划与避障
建图完成后,机器人需要规划从A到B的路径。工业级方案通常采用:
- 全局规划:A*或Dijkstra算法在已知地图上搜索最短路径
- 局部规划:DWA(动态窗口法)或TEB(时间弹性带)在执行过程中实时避障和调整轨迹
- 足端规划:这是四足机器人特有的——在已知路径上,还要决定每一步踩在哪里(踏脚点规划)。常用的方法是基于高度图的代价地图,评估每个候选踏脚点的稳定性
3.3 人机交互
消费级四足机器人与工业巡检机器人的最大区别在于交互体验。用户期望:
- 语音交互:自然语言指令(”过来”、”坐下”、”跟紧我”),通常接入云端ASR+本地NLP
- 手势识别:通过摄像头识别主人的手势指令,适用于嘈杂环境
- 触摸反馈:头部和背部的触摸传感器,摸头表示表扬,拍背表示跟随
- 表情显示:面部屏幕显示不同表情(开心、疑惑、困倦),增强情感连接
四、产业格局:谁在跑,谁在追
4.1 全球主要玩家
| 公司 | 产品 | 定位 | 价格区间 | 技术亮点 |
|---|---|---|---|---|
| 波士顿动力 | Spot | 工业巡检 | ~50万RMB | 最成熟的工业四足,全自主导航 |
| 宇树科技 | B2/Go2/A1 | 工业+教育 | 9.9万起 | QDD执行器,自研控制算法 |
| 小米 | CyberDog 2 | 开发者/爱好者 | 1.3万 | 开源友好,社区活跃 |
| 可以科技 | Loona | 家庭陪伴 | ~3000RMB | 情感交互,AI驱动的个性养成 |
| 松山湖机器人 | O2 | 教育科研 | ~5万 | 低成本开源平台 |
4.2 技术趋势
趋势一:AI大模型上车。2025年起,多家厂商开始将大语言模型(LLM)集成到四足机器人中,实现更自然的对话和任务理解。例如用户说”帮我把桌上的遥控器拿来”,机器人需要理解语义、定位目标、规划路径、抓取物体——这是一个端到端的AI任务链。
趋势二:强化学习(RL)取代传统控制。传统MPC+WBC方案需要大量参数调试,而强化学习可以让机器人通过仿真训练自动学习最优步态。NVIDIA Isaac Sim等仿真平台已经可以高效训练四足机器人的各种运动技能,部分厂商(如宇树)已开始将RL训练的策略部署到实际硬件上。
趋势三:模块化设计降低成本。通过标准化关节模组、共用的传感器平台,四足机器人的BOM成本正在快速下降。参考手机产业的经验,当核心部件(执行器、主控板、传感器模组)实现标准化后,整机的成本将进入快速下降通道。
五、挑战与展望
尽管四足机器人技术取得了长足进步,但要真正走进千家万户,仍有几个关键瓶颈需要突破:
- 续航时间:当前主流四足机器人的续航在2-4小时,远低于用户预期。核心原因是执行器的能量效率仍然偏低——QDD方案虽然改善了柔顺性,但功耗仍显著高于轮式方案
- 噪音问题:电机+减速器在高扭矩输出时噪音明显,不适合室内安静环境。无框电机+磁悬浮轴承是潜在解决方案,但成本高昂
- 可靠性:高频冲击(每条腿每秒经历2-3次落地冲击)对关节减速器、轴承和连接件提出了严苛的耐久性要求
- 价格:虽然宇树B2已降至9.9万,但距离消费级可接受价位(5000元以下)仍有数量级的差距
四足机器人从实验室走向家庭的故事,才刚刚开始。但技术进步的速度令人振奋——五年前能自主行走还是实验室的专利,如今已成为商业产品的标配功能。对于开发者而言,现在正是参与这个领域的最佳时机。
配图说明

