城市低空无人机航路规划:高密度 CBD 场景下的理论与算法
本文系统梳理城市低空无人机航路规划的理论体系,重点面向高密度 CBD 场景,涵盖从问题建模、单机规划、多机协同到实际部署的全链路算法,提供完整的数学推导与工程权衡分析。
1. 引言:为什么 CBD 特别难?
城市低空经济正在快速崛起。从外卖配送、应急物资到城市安防,无人机的应用场景日益丰富。然而,当我们将无人机从郊区开阔地带入高密度 CBD 时,规划问题的复杂度呈现指数级上升。
1.1 城市低空空域定义
本文所讨论的城市低空特指距地面 300m 以下的空域(Above Ground Level, AGL),这是大多数城市法规规定的无人机可飞行高度上限。在这一范围内,存在三类截然不同的空域层级:
- 地面层(0–30m):建筑物立面干扰区,GPS 信号严重衰减,视觉特征丰富但光照条件多变
- 建筑层(30–120m):城市峡谷主体区域,风场受建筑物尾流效应影响显著
- 过渡层(120–300m):相对开阔,但仍受城市热岛效应和进出港航线约束
1.2 CBD 的三重核心挑战
高密度 CBD 与郊区开阔地的本质区别体现在三个维度:
① 密集建筑群带来的三维空间约束
摩天大楼形成垂直壁障,传统的二维路径规划算法不再适用。需要三维占用表示 + 动态安全半径调整——越靠近建筑物,无人机遭遇突发气流的风险越高,所需的安全裕量反而越大。
② 高密度飞行需求带来的多机冲突
一条商业走廊可能在同一时段承载数十架无人机同时起降,冲突概率随密度平方增长。传统的”先规划后执行”串行模式无法满足实时性要求。
③ 动态障碍的不可预测性
施工塔吊、无人机临时禁飞区、低空鸟群——CBD 的动态障碍在时间和空间上均不可预测,规划算法必须具备在线 replanning 能力。
1.3 与郊区规划的本质区别
| 维度 | 郊区开阔地 | 高密度 CBD |
|---|---|---|
| 空间密度 | 低(可自由选择航路) | 高(航路高度约束) |
| 障碍类型 | 静态为主 | 静态 + 动态混合 |
| 风场特性 | 均匀层流 | 湍流、城市峡谷效应 |
| 多机密度 | 低(稀疏分布) | 高(密集汇聚) |
| GPS 精度 | 良好(开阔天空) | 下降(多径效应) |
| 监管约束 | 相对宽松 | 严格分层管理 |
2. 问题建模:把飞行问题变成数学问题
2.1 空间建模
3D 占用栅格(Occupancy Grid)
将三维空间离散化为体素(Voxel)网格,每个体素标记为占用或空闲:
占用栅格从 GIS 数据、建筑物 CAD 模型或 SLAM 在线建图构建。在实际系统中,通常采用八叉树(Octree) 表示以节省存储——稀疏区域用大节点,密集区域递归细分。
城市峡谷(Urban Canyon)效应
CBD 的建筑物形成峡谷地形,导致三个物理效应:
- 风加速效应:气流在峡谷内加速(Bernoulli 效应),风速可达开阔地的 1.5–2 倍
- 湍流增强:建筑物尾流产生随机湍流,导致无人机姿态扰动
- GPS 多径衰落:信号在建筑物立面反射,造成定位偏差
数学上用一个风险场
其中
空域分层(Layered Airspace)模型
借鉴航空管制的成熟经验,CBD 低空空域可分层管理:
典型
| 高度层 | 高度范围 | 适用方向 |
|---|---|---|
| 50–80m | 东向飞行 | |
| 80–120m | 西向飞行 | |
| 120–180m | 南向飞行 | |
| 180–300m | 北向飞行 |
这种方向-高度绑定策略从源头减少了迎面冲突的概率。
2.2 4D 轨迹定义
无人机轨迹是一个从时间到三维空间的映射:
状态向量包括位置和速度:
安全分离约束(水平 + 垂直同时满足):
典型值:
2.3 优化问题的一般形式
单机航路规划可建模为带约束的最优控制问题:
约束条件包括:
- 碰撞避免:
- 动力学约束:
- 分离约束:
- 边界条件:
3. 单机路径规划算法
3.1 图搜索:A* 算法
A* 是离散航路点规划中最经典的算法,通过启发式搜索在状态空间中找到代价最优路径。
空域图构建:将连续空间离散化为节点(关键航路点)和边(合法飞行廊道)。常用方法包括:
- Visibility Graph:节点为起点、终点和所有多边形障碍的顶点,边为可见连线(不穿越障碍物)
- Waypoint Graph:预定义航路点网络,节点分布在建筑物间隔和交叉口附近
代价评估函数(A* 的核心):
其中:
- 实际代价(从起点累计):
- 启发代价(到目标的估计,从不高估):
(欧氏距离,保证可采纳性)
面向城市风险加权的边代价:
其中
3.2 采样规划:RRT* 算法
当状态空间维度较高且障碍物形状复杂时,基于随机采样的 RRT* 算法更具优势。
算法核心步骤:
- 随机采样:在自由空间中均匀采样一个状态
- 最近邻搜索:
- Steer(导向):以步长
朝随机状态延伸: - 重连(Rewire):检查是否能以更低价廉的父节点替换现有父节点
最近邻球半径(渐近最优半径):
其中
重连条件(替换父节点当且仅当新路径更便宜):
渐近最优性保证(RRT* 区别于普通 RRT 的关键):
即随着采样点增加,RRT* 能以概率 1 收敛到全局最优解。
3.3 人工势场法(APF)
APF 将无人机视为在势能场中运动的粒子,引力指向目标,斥力来自障碍物。
引力势能(目标方向,二次势阱):
斥力势能(障碍物影响范围内激活):
其中
合力为势能的负梯度:
显式梯度分量:
APF 的优点是计算量极小(
3.4 快速行进平方法(FM²)
Fast Marching Square (FM²) 以速度图驱动波前传播,自动生成平滑 4D 轨迹,特别适合城市峡谷地形。
Eikonal 方程(波前到达时间满足):
其中
基于净空场
障碍物附近
从到达时间场提取路径(沿负梯度下降):
4D 扩展——时空冲突区时变速度图:
其中
FM² 的优势在于路径天然平滑(波前传播的数学性质保证),且可以方便地融合多目标(速度、能耗、风险)到同一速度图中。
4. 高密度场景核心问题:冲突探测与解除
当多架无人机同时在 CBD 空域运行时,冲突探测与解除(CD/R)是保证飞行安全的核心技术。
4.1 冲突探测(CD - Conflict Detection)
采用 NASA UTM 标准的两层分离保护盾:水平分离
在常速假设下(预测窗口内速度恒定):
最近接近点时间(CPA):
CPA 处的最小分离距离:
冲突判定:
4.2 冲突解除(CR - Conflict Resolution)
三大经典策略:
策略一:速度调整(Speed Adjustment)
对 UAV
最优
策略二:航向偏转(Heading Change)
在水平面内施加航向角扰动
最小满足分离的偏转角:
策略三:高度层分离(Altitude Layer Assignment)
基于方向的静态高度分配(见 2.1 节的分层模型),从源头避免水平面内的迎面冲突,是 CBD 场景最推荐的方案。
4.3 集中式 vs 分散式协调
| 架构 | 优点 | 缺点 | 适用规模 |
|---|---|---|---|
| 集中式 UTM | 全局最优 | 通信开销 | <20 架 |
| 分散式 VO/ORCA | 无中心通信 | 仅局部最优 | 20–200 架 |
| 混合 CTDE | 可扩展性强 | 训练复杂 | >200 架 |
Velocity Obstacle (VO):由 UAV
其中
ORCA(最优互惠避碰):每个智能体负责一半避让义务:
其中
可行速度集:
其中
5. 基于图论的城市空域建模
5.1 航路网络图构建
将城市低空空域抽象为加权有向图:
复合边权重(多目标标量化):
其中
廊道容量约束(最大同时容纳无人机数):
空域占用张量(时空占用栅格的 4D 扩展):
5.2 能耗模型(旋翼无人机)
旋翼无人机的能耗模型由叶片动量理论(BEMT)推导。
悬停功率(Blade Element Momentum Theory):
其中
前飞功率(Zeng et al., 2019):
其中
航段能耗(以速度
能效最优巡航速度(单位距离能耗最小):
通常
6. 风场影响与城市峡谷效应
6.1 风场建模
城市峡谷风速 Weibull 分布:
其中
对数风剖面(地面层,高度低于屋顶):
其中
有效地速(考虑侧风影响):
风场修正后的航行时间:
湍流强度指数(量化廊道风风险):
6.2 安全半径动态调整
近建筑物时涡流加剧,保护半径随高度余量缩小而增大:
其中
综合障碍-净空约束:
7. 多机协同优化:MILP 方法
7.1 问题建模为整数规划
为每架 UAV
目标函数(最小化总完成时间与能耗加权和):
决策变量:
:UAV 是否经过边
流量守恒约束(每架无人机进入和离开每个中间节点):
其中
廊道容量约束(同时最多
时间一致性约束(到达时间与路径一致):
时间分离约束(共享节点时 UAV 间保持时间间隔):
利用大 M 法线性化(
MINLP 扩展(当速度
MILP/MINLP 的优势在于全局最优性保证,缺点是计算复杂度随 UAV 数量指数增长,通常用于离线大规模协同规划或离线基准算法对比。
8. 强化学习方法(MARL)
当 UAV 规模超过 50 架时,MILP 的计算时间难以满足实时性要求。MARL(多智能体强化学习)提供了从数据中学习实时策略的替代路径。
8.1 MARL 方案架构
状态空间:本地位置 + 速度 + 邻居相对状态
动作空间:离散方向集合
个体奖励设计:
包含到达奖励、步进代价、冲突惩罚和绕路惩罚。
DQN 更新(离散动作空间):
其中
8.2 图注意力机制(GAT)——建模邻居 UAV
CBD 空域的通信拓扑是动态的,需要注意力机制自适应加权邻居影响:
8.3 PPO 策略梯度(混合动作空间)
PPO Clip 目标函数:
其中
CTDE 架构(集中式训练 + 分散式执行):
- ** Critic(批评者)**:训练时使用全局状态
估计价值函数 - ** Actor(行动者)**:执行时仅使用本地观测
,保证在线执行的可扩展性
9. 轨迹平滑与动力学约束
9.1 Bézier 曲线轨迹生成
A* / RRT* 输出的路径是离散的航路点序列,需要用连续曲线拟合以满足无人机的动力学可行性。
其中
速度曲线(Bézier 的一阶导):
曲率约束(限制向心加速度):
9.2 Minimum Snap 轨迹平滑
四旋翼无人机的动力学约束使其**最小Snap(最小四阶导数积分)**轨迹在工程中被广泛采用:
转化为二次规划(分段多项式形式):
其中
Minimum Snap 的优点是解析最优解存在(QP 有闭式解),计算量
10. 实际部署挑战与工程考量
10.1 实时性 vs 最优性的权衡
| 算法 | 典型计算时间 | 最优性 | 适用场景 |
|---|---|---|---|
| A* | 全局最优 | 稀疏障碍, | |
| RRT* | 渐近最优 | 密集障碍, | |
| FM² | 全局最优 | 实时平滑需求 | |
| MILP | 全局最优 | 离线规划, | |
| ORCA | 局部最优 | 实时避碰, | |
| MARL | 局部最优 | 超大规模, |
10.2 通信延迟的影响
分布式协调算法的预测精度受通信延迟
预测误差随
10.3 GPS 精度与多源融合
| 定位方式 | 水平精度 | 垂直精度 | 可用性 |
|---|---|---|---|
| 普通 GPS | 全天候 | ||
| GPS + GLONASS | 全天候 | ||
| RTK GPS | 需基站 | ||
| 视觉里程计 | 依赖光照 | ||
| LiDAR SLAM | 室内/隧道 |
城市峡谷中 GPS 多径效应使普通 GPS 精度降至
10.4 监管框架
| 地区 | 法规 | 关键约束 |
|---|---|---|
| 中国 | CAAC《无人驾驶航空器飞行管理暂行条例》 | 实名登记,120m 高度上限 |
| 欧盟 | EASA U-Space | U-Space 服务商注册 |
| 美国 | FAA UTM CONOPS | Remote ID,LAANC 授权 |
11. 总结与展望
各方法对比
| 算法 | 计算复杂度 | 最优性 | 实时性 | 多机扩展性 |
|---|---|---|---|---|
| A* | ✅ 全局最优 | ⭐⭐⭐⭐ | ⭐(差) | |
| RRT* | 渐近最优 | ⭐⭐⭐ | ⭐(差) | |
| APF | ❌ 局部极小 | ⭐⭐⭐⭐⭐ | ⭐(差) | |
| FM² | ✅ 全局最优 | ⭐⭐⭐⭐ | ⭐⭐(中) | |
| MILP | ✅ 全局最优 | ⭐(差) | ⭐(差) | |
| ORCA | ❌ 局部最优 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐(良) | |
| MARL | ❌ 局部最优 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐(优) |
未来方向
- 数字孪生实时映射:利用传感器网络实时构建城市低空数字孪生,为规划算法提供高分辨率的动态环境模型
- 在线 MARL + 元学习:通过元学习(MAML/RL²)实现快速策略适应,新城市环境仅需少量样本即可部署
- 大语言模型(LLM)任务分解:LLM 作为任务规划器,将高层任务指令分解为底层航路点序列,结合传统规划算法执行
- V2X(无人机-设施-无人机)通信:5G/6G 网络下的低延迟 V2X 通信,使分散式算法能获取更精确的邻居状态信息
📚 相关阅读
本文的理论框架综合参考了 UTM (NASA)、EASA U-Space、CAAC 相关技术规范,以及 Schopper et al. (2019)、Zeng et al. (2019)、Zhou et al. (2019) 等学术成果。