机器人学基础知识

PLC工控笔记 · 4 小时前

PLC技术网抖音群

具身智能（Embodied AI）的核心在于“具身”，而理解“身体”的物理规律和数学表达，是解读一切前沿算法（如VLA模型、Sim2Real、全身控制）的基石。

很多论文中复杂的公式，本质上都是在描述物体如何在空间中运动、受力以及如何保持平衡。如果看不懂这些“字母”代表的物理意义，就很难理解算法设计的初衷。

以下梳理了具身智能最核心的“通用逻辑基础”——旋转、Twist、Wrench 与运动学/动力学。掌握这些，你就能看懂论文中那些模型背后的物理直觉。

一、姿态与旋转：描述“身体”在哪里

在具身智能中，首先要解决的问题是：机器人现在的姿态是什么？这不仅涉及位置，更涉及方向。

1. 坐标系与变换

机器人学的基础是坐标系。通常我们需要定义：

* 世界坐标系：绝对参考系。

* 本体坐标系：固定在机器人躯干上的坐标系。

* 末端/关节坐标系：固定在机械臂末端或关节上的坐标系。

核心逻辑：论文中常出现的 T_{ab} 或 ^A T_B，本质上是一个齐次变换矩阵，它描述了坐标系 B 相对于坐标系 A 的位置和旋转。

2. 旋转表示的“坑”与选择

描述旋转主要有两种方式，理解它们的区别对阅读论文至关重要：

* 欧拉角：

* 直观：即 Roll（滚转）、Pitch（俯仰）、Yaw（偏航）。

* 缺陷：存在万向节锁问题，且在插值时会产生非平滑路径。论文中若涉及轨迹优化，通常避免直接使用欧拉角。

* 约定陷阱：不同软件（如ROS、Unity、Blender）对旋转顺序（XYZ vs ZYX）和轴向（Y-up vs Z-up）的定义不同，这是导致 Sim2Real 失败或模型导入错误的常见原因。

* 四元数：

* 优势：计算高效，无万向节锁，适合插值。

* 结构：通常表示为 q = [w, x, y, z] 或 [x, y, z, w]。

* 注意：阅读代码或论文时，必须确认其使用的是标量优先还是向量优先，否则会导致姿态解算完全错误。

二、 Twist 与 Wrench：描述“运动”与“力”

这是理解机器人动力学的关键。为了数学形式的统一和计算的优雅，我们将线量和角量组合在一起，形成了空间向量。

1. Twist（旋量/运动螺旋）

Twist 描述了刚体的瞬时运动状态。它将线速度和角速度“捆绑”在一起。

* 定义：一个 6 维向量，通常表示为 nu = [v, omega]。

* v：线速度（Linear Velocity）。

* omega：角速度（Angular Velocity）。

* 核心逻辑：在论文中，当你看到速度运动学方程 dot{x} = J(q)dot{q} 时，这里的 dot{x} 本质上就是操作空间中的 Twist。它描述了末端执行器在空间中的瞬时移动和旋转趋势。

2. Wrench（力旋量）

Wrench 是 Twist 的对偶概念，描述了作用在刚体上的力与力矩。

* 定义：一个 6 维向量，通常表示为 F = [f, tau]。

* f：力（Force）。

* tau：力矩（Torque）。

* 核心逻辑：

* 雅可比转置关系：这是控制领域的“圣杯”公式之一。如果我们知道末端需要产生多大的力（Wrench），可以通过雅可比矩阵的转置 J^T 将其映射回关节空间，计算出电机需要输出多大的力矩：

tau_{joint} = J(q)^T F_{end}

* 应用：在足式机器人（如Unitree G1）的全身控制中，Wrench 用于描述地面反作用力，算法通过优化 Wrench 来保持机器人平衡。

三、运动学：描述“骨骼”的几何关系

运动学只关心几何位置，不关心力。它是连接“关节空间”（电机角度）和“操作空间”（手/脚的位置）的桥梁。

1. 正运动学

* 问题：已知所有关节角度 theta，求末端在哪里？

* 逻辑：通过连杆变换矩阵连乘，从基座一直推导到末端。这是最基础的计算，几乎所有机器人算法的第一步。

2. 逆运动学

* 问题：已知我想让手摸到杯子（目标位置 X_{target}），求各个关节应该转多少度？

* 难点：解可能不唯一（冗余自由度），或者无解（够不着）。

* 前沿应用：在具身智能的遥操作中（如使用 Apple Vision Pro 控制机器人），算法需要实时解算逆运动学，将人的手部动作映射到机器人的关节上。

3. 雅可比矩阵

它是运动学的核心，是一个偏导数矩阵，建立了关节速度 dot{q} 与末端速度 V 的线性映射关系：

V = J(q)dot{q}

* 物理意义：它描述了关节的微小运动如何影响末端的运动。

* 奇异性：当雅可比矩阵不可逆（行列式为0）时，机器人处于奇异点，此时某些方向的运动无法实现，或者需要无限大的关节速度。

四、动力学：描述“力”如何产生“运动”

动力学引入了质量和力，回答了“需要多大的力才能让机器人动起来”的问题。

1. 欧拉-拉格朗日方程

这是机器人动力学的标准形式，也是理解模型预测控制的基础。公式如下：

M(q)ddot{q} + C(q, dot{q})dot{q} + G(q) = tau

这一长串公式其实只讲了三个物理分量：

* M(q)ddot{q}（惯性项）：

* M(q) 是质量矩阵。它表示机器人想要加速（ddot{q}），必须克服自身的惯性。

* C(q, dot{q})dot{q}（科里奥利力与离心力项）：

* 这是由运动本身产生的“虚拟力”。比如你坐在旋转木马上会感觉被向外甩，这就是离心力。在高速运动的机械臂中，这一项不可忽略。

* G(q)（重力项）：

* 机器人必须输出力矩来对抗重力，否则手臂会掉下来。

* tau（广义力）：

* 电机实际输出的力矩。

核心价值：前沿的全身控制算法，本质上就是在实时求解这个方程，通过调整 tau 来让机器人既保持平衡（对抗 G），又完成动作（克服 M 和 C）。

总结：基础概念与前沿应用的映射

为了帮你快速建立联系，我整理了这份对照表：

基础概念数学符号/工具前沿论文中的应用场景核心价值

旋转表示四元数、旋转矩阵 Sim2Real、数字孪生解决不同仿真器（Isaac Sim vs MuJoCo）间的坐标系对齐问题。

Twist/Wrench 6维空间向量全身控制、力位混合控制统一描述运动与受力，实现足式机器人的动态平衡。

雅可比矩阵 J(q) 遥操作、阻抗控制将人的动作映射给机器人，或将接触力映射回关节力矩。

动力学方程 Mddot{q} + Cdot{q} + G = tau 强化学习奖励函数设计、MPC 确保生成的动作符合物理规律，避免机器人“摔倒”或“自毁”。

建议：

在阅读具身智能论文时，不要被复杂的神经网络架构图迷惑，试着去寻找上述公式的身影。你会发现，无论是模仿学习还是强化学习，其底层的状态空间定义（通常包含位置和Twist）和动作空间定义（通常涉及关节力矩或目标位置），都是建立在这些经典机器人学基础之上的。

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

微信公众号二维码	抖音二维码	百家号二维码	今日头条二维码	哔哩哔哩二维码

机器人学基础知识

更多帖子推荐

浏览过的版块

热点推荐更多

傲拓PLC写模拟量输入的方法

新疆之行

九江市博物馆一游

TIA Portal常用通信处理器库含义及使用

小张读书记之《墨菲定律》

控制柜介绍

设备安装

水温水压表设置

整流柜介绍

某铝厂二极管整流装置总PLC控制逻辑总结

机器人学基础知识

更多帖子推荐

浏览过的版块

热点推荐 更多

傲拓PLC写模拟量输入的方法

新疆之行

九江市博物馆一游

TIA Portal常用通信处理器库含义及使用

小张读书记之《墨菲定律》

控制柜介绍

设备安装

水温水压表设置

整流柜介绍

某铝厂二极管整流装置总PLC控制逻辑总结

热点推荐更多