城市低空无人机航路规划：高密度 CBD 场景下的理论与算法

本文系统梳理城市低空无人机航路规划的理论体系，重点面向高密度 CBD 场景，涵盖从问题建模、单机规划、多机协同到实际部署的全链路算法，提供完整的数学推导与工程权衡分析。

1. 引言：为什么 CBD 特别难？

城市低空经济正在快速崛起。从外卖配送、应急物资到城市安防，无人机的应用场景日益丰富。然而，当我们将无人机从郊区开阔地带入高密度 CBD 时，规划问题的复杂度呈现指数级上升。

1.1 城市低空空域定义

本文所讨论的城市低空特指距地面 300m 以下的空域（Above Ground Level, AGL），这是大多数城市法规规定的无人机可飞行高度上限。在这一范围内，存在三类截然不同的空域层级：

地面层（0–30m）：建筑物立面干扰区，GPS 信号严重衰减，视觉特征丰富但光照条件多变
建筑层（30–120m）：城市峡谷主体区域，风场受建筑物尾流效应影响显著
过渡层（120–300m）：相对开阔，但仍受城市热岛效应和进出港航线约束

1.2 CBD 的三重核心挑战

高密度 CBD 与郊区开阔地的本质区别体现在三个维度：

① 密集建筑群带来的三维空间约束

摩天大楼形成垂直壁障，传统的二维路径规划算法不再适用。需要三维占用表示 + 动态安全半径调整——越靠近建筑物，无人机遭遇突发气流的风险越高，所需的安全裕量反而越大。

② 高密度飞行需求带来的多机冲突

一条商业走廊可能在同一时段承载数十架无人机同时起降，冲突概率随密度平方增长。传统的”先规划后执行”串行模式无法满足实时性要求。

③ 动态障碍的不可预测性

施工塔吊、无人机临时禁飞区、低空鸟群——CBD 的动态障碍在时间和空间上均不可预测，规划算法必须具备在线 replanning 能力。

1.3 与郊区规划的本质区别

维度	郊区开阔地	高密度 CBD
空间密度	低（可自由选择航路）	高（航路高度约束）
障碍类型	静态为主	静态 + 动态混合
风场特性	均匀层流	湍流、城市峡谷效应
多机密度	低（稀疏分布）	高（密集汇聚）
GPS 精度	良好（开阔天空）	下降（多径效应）
监管约束	相对宽松	严格分层管理

2. 问题建模：把飞行问题变成数学问题

2.1 空间建模

3D 占用栅格（Occupancy Grid）

将三维空间离散化为体素（Voxel）网格，每个体素标记为占用或空闲：

占用栅格从 GIS 数据、建筑物 CAD 模型或 SLAM 在线建图构建。在实际系统中，通常采用八叉树（Octree） 表示以节省存储——稀疏区域用大节点，密集区域递归细分。

城市峡谷（Urban Canyon）效应

CBD 的建筑物形成峡谷地形，导致三个物理效应：

风加速效应：气流在峡谷内加速（Bernoulli 效应），风速可达开阔地的 1.5–2 倍
湍流增强：建筑物尾流产生随机湍流，导致无人机姿态扰动
GPS 多径衰落：信号在建筑物立面反射，造成定位偏差

数学上用一个风险场 来量化第个体素的风险：

其中为第区的湍流强度指数，为周边建筑物高度。

空域分层（Layered Airspace）模型

借鉴航空管制的成熟经验，CBD 低空空域可分层管理：

典型分层方案（基于飞行方向分配高度）：

高度层	高度范围	适用方向
	50–80m	东向飞行
	80–120m	西向飞行
	120–180m	南向飞行
	180–300m	北向飞行

这种方向-高度绑定策略从源头减少了迎面冲突的概率。

2.2 4D 轨迹定义

无人机轨迹是一个从时间到三维空间的映射：

状态向量包括位置和速度：

安全分离约束（水平 + 垂直同时满足）：

典型值：（水平），（垂直），参考 NASA UTM 标准。

2.3 优化问题的一般形式

单机航路规划可建模为带约束的最优控制问题：

约束条件包括：

碰撞避免：
动力学约束：
分离约束：
边界条件：

3. 单机路径规划算法

3.1 图搜索：A* 算法

A* 是离散航路点规划中最经典的算法，通过启发式搜索在状态空间中找到代价最优路径。

空域图构建：将连续空间离散化为节点（关键航路点）和边（合法飞行廊道）。常用方法包括：

Visibility Graph：节点为起点、终点和所有多边形障碍的顶点，边为可见连线（不穿越障碍物）
Waypoint Graph：预定义航路点网络，节点分布在建筑物间隔和交叉口附近

代价评估函数（A* 的核心）：

其中：

实际代价（从起点累计）：
启发代价（到目标的估计，从不高估）：（欧氏距离，保证可采纳性）

面向城市风险加权的边代价：

其中是航段长度，是廊道地面风险评分（来自 2.1 节的风险场），为风险权重系数（典型值 0.5–2.0）。

3.2 采样规划：RRT* 算法

当状态空间维度较高且障碍物形状复杂时，基于随机采样的 RRT* 算法更具优势。

算法核心步骤：

随机采样：在自由空间中均匀采样一个状态
最近邻搜索：
Steer（导向）：以步长朝随机状态延伸：
重连（Rewire）：检查是否能以更低价廉的父节点替换现有父节点

最近邻球半径（渐近最优半径）：

其中为当前树节点数，为空间维度，为与空间体积相关的常数。

重连条件（替换父节点当且仅当新路径更便宜）：

渐近最优性保证（RRT* 区别于普通 RRT 的关键）：

即随着采样点增加，RRT* 能以概率 1 收敛到全局最优解。

3.3 人工势场法（APF）

APF 将无人机视为在势能场中运动的粒子，引力指向目标，斥力来自障碍物。

引力势能（目标方向，二次势阱）：

斥力势能（障碍物影响范围内激活）：

其中为到最近障碍物的距离，为影响半径，为斥力增益。

合力为势能的负梯度：

显式梯度分量：

APF 的优点是计算量极小（，为障碍物数），适合实时控制；缺点是在窄通道中容易陷入局部极小——这是 CBD 密集建筑群场景的致命缺陷，通常需要引入随机扰动或势场隧道机制。

3.4 快速行进平方法（FM²）

Fast Marching Square (FM²) 以速度图驱动波前传播，自动生成平滑 4D 轨迹，特别适合城市峡谷地形。

Eikonal 方程（波前到达时间满足）：

其中为波前到达的时间，为该点的速度。

基于净空场的速度图：

障碍物附近，速度趋近于零；开阔区域速度最大。

从到达时间场提取路径（沿负梯度下降）：

4D 扩展——时空冲突区时变速度图：

其中在时空冲突区衰减至接近零，自动绕开其他无人机的预测轨迹。

FM² 的优势在于路径天然平滑（波前传播的数学性质保证），且可以方便地融合多目标（速度、能耗、风险）到同一速度图中。

4. 高密度场景核心问题：冲突探测与解除

当多架无人机同时在 CBD 空域运行时，冲突探测与解除（CD/R）是保证飞行安全的核心技术。

4.1 冲突探测（CD - Conflict Detection）

采用 NASA UTM 标准的两层分离保护盾：水平分离 + 垂直分离 ，两者同时触发才判定为冲突：

在常速假设下（预测窗口内速度恒定）：

最近接近点时间（CPA）：

CPA 处的最小分离距离：

冲突判定：且且。

4.2 冲突解除（CR - Conflict Resolution）

三大经典策略：

策略一：速度调整（Speed Adjustment）

对 UAV 施加速度缩放因子：

最优在最小化速度偏差的同时满足时间分离约束：

策略二：航向偏转（Heading Change）

在水平面内施加航向角扰动：

最小满足分离的偏转角：

策略三：高度层分离（Altitude Layer Assignment）

基于方向的静态高度分配（见 2.1 节的分层模型），从源头避免水平面内的迎面冲突，是 CBD 场景最推荐的方案。

4.3 集中式 vs 分散式协调

架构	优点	缺点	适用规模
集中式 UTM	全局最优	通信开销	<20 架
分散式 VO/ORCA	无中心通信	仅局部最优	20–200 架
混合 CTDE	可扩展性强	训练复杂	>200 架

Velocity Obstacle (VO)：由 UAV 诱导的 VO 是导致碰撞的速度集合：

其中为以为半径的安全盘。

ORCA（最优互惠避碰）：每个智能体负责一半避让义务：

其中为达到 VO 边界所需的最小速度改变量。

可行速度集：

其中编码了无人机的最大速度和加速度约束。

5. 基于图论的城市空域建模

5.1 航路网络图构建

将城市低空空域抽象为加权有向图：

复合边权重（多目标标量化）：

其中为欧氏距离，为风场修正后的时间代价，为地面风险评分（2.1 节），为能耗代价。

廊道容量约束（最大同时容纳无人机数）：

空域占用张量（时空占用栅格的 4D 扩展）：

5.2 能耗模型（旋翼无人机）

旋翼无人机的能耗模型由叶片动量理论（BEMT）推导。

悬停功率（Blade Element Momentum Theory）：

其中为无人机质量，为重力加速度，为空气密度，为旋翼盘面积。

前飞功率（Zeng et al., 2019）：

其中为叶片轮廓功率，为诱导功率（悬停），为旋翼翼尖速度，为悬停诱导速度，为机身阻力比，为实度，为旋翼盘面积。

航段能耗（以速度飞过长度的航段）：

能效最优巡航速度（单位距离能耗最小）：

通常在范围内（取决于无人机重量和旋翼配置）。

6. 风场影响与城市峡谷效应

6.1 风场建模

城市峡谷风速 Weibull 分布：

其中为形状参数（典型值），为尺度参数（来自当地实测数据）。

对数风剖面（地面层，高度低于屋顶）：

其中为摩擦速度，（冯·卡门常数），为零平面位移，为粗糙长度。

有效地速（考虑侧风影响）：

风场修正后的航行时间：

湍流强度指数（量化廊道风风险）：

6.2 安全半径动态调整

近建筑物时涡流加剧，保护半径随高度余量缩小而增大：

其中为飞行高度，为建筑物高度，为正则项（避免除零）。

综合障碍-净空约束：

7. 多机协同优化：MILP 方法

7.1 问题建模为整数规划

为每架 UAV 同时分配路径和时隙，求解全局协同最优：

目标函数（最小化总完成时间与能耗加权和）：

决策变量：

：UAV 是否经过边

流量守恒约束（每架无人机进入和离开每个中间节点）：

其中（若为的起点），（若为的终点），否则。

廊道容量约束（同时最多架 UAV）：

时间一致性约束（到达时间与路径一致）：

时间分离约束（共享节点时 UAV 间保持时间间隔）：

利用大 M 法线性化（为序贯变量）：

MINLP 扩展（当速度也是优化变量时，能耗同时被优化）：

MILP/MINLP 的优势在于全局最优性保证，缺点是计算复杂度随 UAV 数量指数增长，通常用于离线大规模协同规划或离线基准算法对比。

8. 强化学习方法（MARL）

当 UAV 规模超过 50 架时，MILP 的计算时间难以满足实时性要求。MARL（多智能体强化学习）提供了从数据中学习实时策略的替代路径。

8.1 MARL 方案架构

状态空间：本地位置 + 速度 + 邻居相对状态

动作空间：离散方向集合 + 速度档位

个体奖励设计：

包含到达奖励、步进代价、冲突惩罚和绕路惩罚。

DQN 更新（离散动作空间）：

其中为在线网络参数，为目标网络参数（定期同步）。

8.2 图注意力机制（GAT）——建模邻居 UAV

CBD 空域的通信拓扑是动态的，需要注意力机制自适应加权邻居影响：

8.3 PPO 策略梯度（混合动作空间）

PPO Clip 目标函数：

其中为概率比，为优势函数估计。

CTDE 架构（集中式训练 + 分散式执行）：

** Critic（批评者）**：训练时使用全局状态估计价值函数
** Actor（行动者）**：执行时仅使用本地观测，保证在线执行的可扩展性

9. 轨迹平滑与动力学约束

9.1 Bézier 曲线轨迹生成

A* / RRT* 输出的路径是离散的航路点序列，需要用连续曲线拟合以满足无人机的动力学可行性。

次 Bézier 曲线：

其中为控制点序列。次数通常取 3–5（阶数越高曲线越灵活，但计算量越大）。

速度曲线（Bézier 的一阶导）：

曲率约束（限制向心加速度）：

9.2 Minimum Snap 轨迹平滑

四旋翼无人机的动力学约束使其**最小Snap（最小四阶导数积分）**轨迹在工程中被广泛采用：

转化为二次规划（分段多项式形式）：

其中编码了 Snap 的平方积分，约束矩阵施加了航路点通过和连续性条件。

Minimum Snap 的优点是解析最优解存在（QP 有闭式解），计算量，非常适合实时在线计算。

10. 实际部署挑战与工程考量

10.1 实时性 vs 最优性的权衡

算法	典型计算时间	最优性	适用场景
A*		全局最优	稀疏障碍，
RRT*		渐近最优	密集障碍，
FM²		全局最优	实时平滑需求
MILP		全局最优	离线规划，
ORCA		局部最优	实时避碰，
MARL	（查表）	局部最优	超大规模，

10.2 通信延迟的影响

分布式协调算法的预测精度受通信延迟严重制约。延迟意味着智能体使用的是时刻的邻居状态进行预测：

预测误差随增大而增大，当时，基于预测的冲突解除算法性能显著下降。

10.3 GPS 精度与多源融合

定位方式	水平精度	垂直精度	可用性
普通 GPS			全天候
GPS + GLONASS			全天候
RTK GPS			需基站
视觉里程计			依赖光照
LiDAR SLAM			室内/隧道

城市峡谷中 GPS 多径效应使普通 GPS 精度降至以上，必须融合 IMU 或视觉里程计才能满足 CBD 环境的飞行安全需求。

10.4 监管框架

地区	法规	关键约束
中国	CAAC《无人驾驶航空器飞行管理暂行条例》	实名登记，120m 高度上限
欧盟	EASA U-Space	U-Space 服务商注册
美国	FAA UTM CONOPS	Remote ID，LAANC 授权

11. 总结与展望

各方法对比

算法	最优性	实时性	多机扩展性
A*	✅ 全局最优	⭐⭐⭐⭐	⭐（差）
RRT*	渐近最优	⭐⭐⭐	⭐（差）
APF	❌ 局部极小	⭐⭐⭐⭐⭐	⭐（差）
FM²	✅ 全局最优	⭐⭐⭐⭐	⭐⭐（中）
MILP	✅ 全局最优	⭐（差）	⭐（差）
ORCA	❌ 局部最优	⭐⭐⭐⭐⭐	⭐⭐⭐（良）
MARL	❌ 局部最优	⭐⭐⭐⭐⭐	⭐⭐⭐⭐（优）

未来方向

数字孪生实时映射：利用传感器网络实时构建城市低空数字孪生，为规划算法提供高分辨率的动态环境模型
在线 MARL + 元学习：通过元学习（MAML/RL²）实现快速策略适应，新城市环境仅需少量样本即可部署
大语言模型（LLM）任务分解：LLM 作为任务规划器，将高层任务指令分解为底层航路点序列，结合传统规划算法执行
V2X（无人机-设施-无人机）通信：5G/6G 网络下的低延迟 V2X 通信，使分散式算法能获取更精确的邻居状态信息

📚 相关阅读

多智能体强化学习与图注意力网络：UAV 集群冲突消解的端到端方案

UAV 集群冲突消解：算法全景图

城市低空 UTM 冲突环境构建：从理论到代码实现

本文的理论框架综合参考了 UTM (NASA)、EASA U-Space、CAAC 相关技术规范，以及 Schopper et al. (2019)、Zeng et al. (2019)、Zhou et al. (2019) 等学术成果。