Planification d'itinéraires urbains de drones à basse altitude : théorie et algorithme dans des scénarios CBD à haute densité
Analyse systématiquement les principaux problèmes et les idées de solutions de la planification d'itinéraires urbains de drones à basse altitude, couvrant les méthodes A*, RRT*, APF, FM², MILP, ORCA et MARL, avec une dérivation mathématique et des équations complètes.
droneplanification du cheminespace aérien urbainAlgorithme d'optimisationUTMrésolution de conflits
Planification d’itinéraires urbains de drones à basse altitude : théorie et algorithme dans des scénarios CBD à haute densité
Lorsque des centaines de drones font la navette entre les gratte-ciel en même temps, la planification d’itinéraire n’est plus un simple problème de « voler d’un point A à un point B » : il s’agit d’un problème d’optimisation contraint de haute dimension qui recherche un équilibre entre l’espace tridimensionnel, le temps, l’énergie et la sécurité.
Introduction : Pourquoi le CBD est-il si difficile ?
L’espace aérien urbain à basse altitude est généralement défini comme la plage de vol 0–300 m (AGL) au-dessus du sol. Ce niveau de hauteur constitue le principal champ de bataille pour la logistique, l’inspection, les interventions d’urgence et d’autres applications des drones. Le CBD (Central Business District) est le sous-scénario le plus complexe pour trois raisons :
1. Des bâtiments denses forment un « canyon urbain »
Les immeubles de grande hauteur rendent les couloirs de vol disponibles extrêmement étroits et la ligne de vue est bloquée, ce qui réduit la précision du GPS. Les bords des bâtiments génèrent également de fortes turbulences. À basse altitude, en dessous de 50 mètres, ces turbulences peuvent complètement faire perdre le contrôle à un petit multirotor.
2. Les drones à haute densité provoquent des conflits intenses
Dans une scène de banlieue, seuls quelques drones peuvent voler en même temps ; tandis que dans le cadre d’un système de gestion du trafic aérien urbain (UTM) mature, le nombre de drones au-dessus du CBD peut atteindre plus de 40 drones par minute. Cela signifie que la détection et la résolution des conflits (CD&R) deviennent le principal goulot d’étranglement du système plutôt qu’une fonction périphérique.
3. Couplage obstacle dynamique et multi-contraintes
En plus des bâtiments, les drones doivent également faire face à des zones d’exclusion aérienne temporaires, à des itinéraires d’avions habités, à des changements de champ de vent en temps réel et à des risques pour la sécurité liés à la densité de la foule au sol - tous ces éléments travaillant ensemble pour rendre difficile la gestion par un algorithme de planification de trajectoire unique.
1. Modélisation de problèmes : transformer des problèmes de vol en problèmes mathématiques
1.1 Grille d’occupation 3D
Discrétisez l’espace urbain dans une grille de voxels, et chaque voxel enregistre son statut d’occupation :
La résolution du voxel est généralement de 1 à 5 m et la région centrale du CBD peut être affinée à 0,5 m. Les données de hauteur des bâtiments proviennent d’une base de données SIG (Système d’information géographique) et sont mises à jour dynamiquement en combinaison avec des capteurs en temps réel.
1.2 Définition mathématique de la trajectoire 4D
La trajectoire de vol d’un seul drone est une courbe spatiale paramétrée par rapport au temps :$$
\boldsymbol{\xi}(t) = \bigl(x(t),; y(t),; z(t)\bigr), \quad t \in [t_0,, t_f]
|\boldsymbol{\xi}_i(t) - \boldsymbol{\xi}_j(t)|2 \geq d{sep}, \quad \forall, i \neq j,; \pour tous, t \in [t_0, t_f]
d(u,v) = \ell_{uv}\cdot\bigl(1 + \beta\cdot\mathcal{R}_{uv}\bigr)
$$Parmi eux, est la longueur du segment du corridor, est le score de risque au sol du corridor (combinant des facteurs tels que la densité de population, le type de bâtiment, les conséquences des accidents, etc.) et est le coefficient de pondération des risques. Cela amène A* à choisir des itinéraires qui survolent des zones à faible risque (par exemple des rivières, des parcs), même s’ils sont légèrement détournés.
Limites de A* : La qualité de la carte de l’espace aérien détermine la qualité de la compréhension. Dans le CBD haute densité, le nombre de nœuds dans le graphe peut atteindre des centaines de milliers, et la construction du graphe lui-même est un défi.
RRT* (Rapidly-exploring Random Tree Star) explore les chemins réalisables en échantillonnant aléatoirement dans un espace continu, ce qui est particulièrement adapté aux scènes d’obstacles complexes et de grande dimension.
Requête du voisin le plus proche - Recherchez le nœud le plus proche du point d’échantillonnage aléatoire dans l’arborescence :
Expansion de l’étape - Étendre la taille du pas de la direction à la direction :
L’amélioration principale de RRT - Rewire :* Recherchez tous les nœuds voisins de la sphère avec comme centre et rayon :
Où est le nombre de nœuds de l’arbre actuel, est la dimension de l’espace (scène 3D ) et est une constante liée au volume d’espace libre. Ce rayon diminue à mesure que les points d’échantillonnage augmentent, garantissant une optimalité asymptotique.
Mise à jour des coûts :
Si le coût de peut être réduit via , la reconnexion est effectuée :$$
\text{Si } c(x_{near}) > c(x_{new}) + d(x_{new},, x_{near}),\text{ puis changez le nœud parent de } x_{near} \text{ en } x_{new}
VO_{ij}^\tau = \left{\mathbf{v}_i ;\middle|; \exists, t\in[0,\tau],; \mathbf{p}_i+\mathbf{v}_i t ;\in; \mathbf{p}_j+\mathbf{v}j t \oplus \mathcal{D}(d{sep})\right}
où est la taille du changement de vitesse minimum et pointe vers la direction normale de la limite .
L’ensemble des vitesses réalisables pour l’agent (coupe toutes les contraintes voisines puis coupe les contraintes dynamiques) :
Parmi eux, code des contraintes dynamiques telles que la vitesse et l’accélération maximales. ORCA a atteint un taux de réussite de 100 % dans des scénarios de densité supérieure à 40 images/minute, avec une complexité de calcul de , ce qui le rend adapté au déploiement en temps réel.
4. Modélisation de la théorie des graphes : réseau d’espace aérien urbain
4.1 Construction du schéma du réseau routier
L’espace aérien urbain est modélisé sous la forme d’un graphe orienté pondéré :
Nœud : au-dessus des intersections routières, des sommets des bâtiments, des points de transfert clés
Edge : couloir de vol légal entre deux nœuds (doit réussir la vérification de détection de collision)
Contraintes de capacité du couloir (le nombre de drones passant en même temps ne dépasse pas la limite supérieure) :
L’état d’occupation de l’ensemble de l’espace aérien peut être décrit par un tenseur à quatre dimensions ( est la grille de voxels, est le nombre de créneaux horaires) :$$
\mathbf{A} \in {0,1}^{N_x\times N_y\times N_z\times N_t}, \quad A_{x,y,z,t} = 1 \iff \exists\text{ voxel occupé par le drone}(x,y,z)\text{ dans la tranche horaire }t
You can't use 'macro parameter character #' in math mode ### 4.2 Modèle de consommation d'énergie du rotor du drone La consommation d'énergie est un objectif d'optimisation important pour la planification d'itinéraires et nécessite une modélisation précise. **Hover Power** (dérivé de la théorie de l'élan des éléments feuilles) :
P(v) = \underbrace{P_0!\left(1+\frac{3v^2}{U_{tip}^2}\right)}{\text{Résistance de la lame}} + \underbrace{P_i!\left(\sqrt{1+\frac{v^4}{4v_0^4}}-\frac{v^2}{2v_0^2}\right)^{!\frac{1}{2}}}{\text{Puissance d’induction}} + \underbrace{\frac{1}{2},d_0,\rho_{air},s,A,v^3}_{\text{Résistance corporelle}}
èéîééé
\mathcal{E}{ij} = \frac{\ell{ij}}{v}\cdot P(v)
èéé
v^* = \arg\min_v \frac{P(v)}{v}
You can't use 'macro parameter character #' in math mode Pour un petit multicoptère typique ($m\approx 1\,\text{kg}$), $v^*$ se situe généralement entre 8 et 12 m/s. ---## 5. Champ de vent et effet canyon urbain ### 5.1 Modélisation des champs de vent urbains La distribution de la vitesse du vent dans les canyons urbains est beaucoup plus complexe qu'à la campagne, et la distribution de Weibull est largement utilisée en modélisation statistique :
TI = \frac{\sigma_u}{\bar{u}}, \qquad \sigma_u = \sqrt{\overline{u’^2}}
You can't use 'macro parameter character #' in math mode Les couloirs avec $TI > 0,3$ sont généralement marqués comme à haut risque, et le planificateur évitera ou augmentera activement le poids des bords de ce segment. ### 5.2 Rayon de sécurité dynamiqueLa turbulence autour des bâtiments augmente fortement à mesure que la marge de hauteur diminue. Par conséquent, la distance de sécurité ne doit pas être une constante fixe, mais doit être ajustée dynamiquement en fonction de l’altitude de vol :
\rho\bigl(\mathbf{p}(t)\bigr) \geq d_{safe}\bigl(z(t)\bigr), \quad \forall, t \in [t_0, t_f]
You can't use 'macro parameter character #' in math mode --- ## 6. Optimisation collaborative multi-machines : modélisation globale MILP Pour le problème conjoint d'allocation de trajectoire et de créneau horaire des drones $N$, un modèle de **Programmation Linéaire Entiers Mixtes (MILP)** peut être établi pour obtenir la solution optimale globale à petite et moyenne échelle ($N\leq 50$). **Fonction objectif** (minimiser le temps de réalisation total et la consommation d'énergie de tous les drones) :
You can't use 'macro parameter character #' in math mode MINLP est un problème NP-difficile qui est résolu approximativement par des algorithmes heuristiques couramment utilisés dans la pratique (recherche fractale aléatoire SFS, optimisation de guépard MCO, etc.). --- ## 7. Solution d'apprentissage par renforcement : MARL et mécanisme d'attention Lorsque l’échelle des drones dépasse la centaine, la complexité informatique du MILP est inacceptable. **L'apprentissage par renforcement multi-agents (MARL)** offre une alternative à la formation hors ligne et à l'inférence extrêmement rapide. ### 7.1 Conception de la fonction de récompense La récompense reçue par chaque drone $i$ au pas de temps $t$ :
r_i^t = r_{arriver}\cdot\mathbf{1}[objectif] - c_{étape} - c_{conflit}\cdot\mathbf{1}[conflit] - c_{détour}\cdot|\mathbf{p}i^t - \mathbf{p}{direct}|
$$La signification de chaque élément : est la récompense positive pour avoir atteint l’objectif ; est la pénalité de temps pour chaque étape de vol ; est la pénalité lorsqu’un conflit survient ; est la pénalité de détour pour s’écarter de la ligne droite.
7.2 Mise à jour Double-DQN (espace d’action discret)
Le réseau en ligne sélectionne les actions et le réseau cible évalue les valeurs, dissociant la sélection et l’évaluation pour réduire les biais de surestimation.
7.3 Mécanisme d’attention : modélisation de l’influence du voisin
La prise de décision de chaque drone dans le CBD nécessite de détecter le statut de ses voisins environnants. Le mécanisme d’attention permet à l’agent de pondérer dynamiquement l’influence des voisins :
Le poids d’attention reflète la pertinence du voisin dans la prise de décision de l’agent . Les voisins proches et en conflit de vitesse important reçoivent naturellement des pondérations plus élevées.
7.4 Dégradé de politique PPO (espace d’action continu/mixte)$$
You can't use 'macro parameter character #' in math mode L'opération Clip limite la taille de l'étape de mise à jour à la plage $[1-\varepsilon,\, 1+\varepsilon]$ (généralement $\varepsilon=0,2$) pour éviter que la formation ne plante en raison de mises à jour excessives des politiques. **Paradigme de formation centralisée et d'exécution décentralisée (CTDE) :** - **Phase de formation** : le réseau d'évaluation $V(s^{global};\phi)$ utilise l'état global et peut percevoir toutes les informations sur les agents - **Phase d'exécution** : Le réseau de politiques $\pi_\theta(a_i\mid o_i)$ utilise uniquement les observations locales de l'agent $i$, sans communication --- ## 8. Lissage de trajectoire : courbe de Bézier et accrochage minimum Le résultat de la planification d'un chemin est souvent une série de points de cheminement discrets, et le suivi direct de ces points de cheminement produira des virages serrés irréalisables. Il est nécessaire de générer des trajectoires continues réalisables dynamiquement grâce au **lissage de trajectoire**. ### 8.1 Courbe de Bézier Une courbe de Bézier d'ordre $n$ est définie par $n+1$ points de contrôle $\{\mathbf{P}_i\}$ :
\boldsymbol{\xi}(u) = \sum_{i=0}^{n}\binom{n}{i}(1-u)^{n-i}u^i,\mathbf{P}_i, \quad u \in [0,1]
You can't use 'macro parameter character #' in math mode ### 8.2 Minimum Snap : La solution standard pour les quadricoptères Pour un drone quadricoptère, minimiser Snap (la dérivée seconde de l'accélération) équivaut à minimiser le taux de changement de poussée requise, ce qui entraîne une dynamique de vol optimale :
You can't use 'macro parameter character #' in math mode La matrice $\mathbf{Q}$ code l'intégrale Snap (peut être calculée analytiquement) et la contrainte d'égalité $\mathbf{A}_{eq}\mathbf{c}=\mathbf{b}_{eq}$ force la trajectoire à passer par tous les points du trajet et assure la continuité de la position, de la vitesse et de l'accélération entre les segments. --- ## 9. Comparaison horizontale des méthodes| Méthode | Complétude | Optimalité | Complexité temporelle | En temps réel | Évolutivité multi-machines | |------|--------|--------|------------|--------|------------| | **A\*** | Terminé | Optimal (graphe discret) | $O(b^d)$ | Moyen | Pauvre | | **RRT\*** | Probablement complet | Asymptotiquement optimal | $O(n\log n)$ | Mieux | Moyen | | **APF** | Incomplet | Aucune garantie | $O(1)$/étape | Excellent | Bon | | **FM²** | Terminé | Optimal (continu) | $O(N\log N)$ | Moyen | Moyen | | **MILP** | Terminé | Globale optimale | NP-dur | Pauvre | Moyen ($N\leq50$) | | **ORQUE** | Probablement complet | Optimale locale | $O(N^2)$ | Excellent | Excellent | | **MARL+À l'attention** | Probabilité complète | approximatif | Entraînement intensif, inférence rapide | Bon | Excellent | **Suggestions de sélection :** - **Exigences de sécurité élevées et à petite échelle** ($N\leq 20$) → MILP global optimal - **Échelle moyenne, sensible au temps réel** ($20 < N \leq 100$) → A\* / RRT\* + résolution de conflits ORCA - **Grande échelle, haute densité** ($N > 100$) → MARL + mécanisme d'attention (délai d'inférence $< 10\,\text{ms}$) --- ## 10. Résumé et perspectives La planification d'itinéraires urbains à basse altitude, en particulier à haute densité, pour les drones dans les scénarios CBD, est un problème d'ingénierie système multidisciplinaire. Cet article trie la chaîne complète des méthodes, depuis la **planification de chemin sur une seule machine** (A\*, RRT\*, APF, FM²) jusqu'à la **résolution de conflits multi-machines** (CD&R, ORCA, MILP) jusqu'aux **méthodes d'apprentissage** (MARL, PPO, attention), et donne l'expression mathématique précise de chaque maillon central. **Trois principaux défis non résolus :** 1. **Replanification en ligne en temps réel** : Lorsqu'une zone d'exclusion aérienne soudaine ou une panne de drone se produit, le système doit terminer la replanification de toutes les trajectoires affectées dans un délai de 200 ms. Actuellement, MILP est loin de répondre à cette exigence et MARL est le candidat le plus prometteur.2. **Jumeaux numériques et fusion des perceptions** : des cartes urbaines tridimensionnelles précises en temps réel (y compris la construction dynamique de bâtiments, les enceintes temporaires et les informations météorologiques) constituent la base de la qualité de la planification des itinéraires. La technologie des jumeaux numériques devrait permettre une synchronisation de l’état de l’espace aérien au niveau centimétrique et inférieur à la seconde. 3. **Mise en œuvre technique du cadre réglementaire** : Les réglementations de gestion à basse altitude de l'Administration de l'aviation civile de Chine (CAAC), l'U-Space européen de l'EASA et l'UTM CONOPS américain de la FAA ont tous des exigences claires en matière de temps de résolution des conflits, de format de soumission du plan de vol, de procédures d'atterrissage d'urgence, etc., et la conception des algorithmes doit être profondément liée aux limites réglementaires. > D'un point de vue mathématique, la planification de routes aériennes urbaines à basse altitude est un problème d'optimisation contraint en temps réel, non convexe, non linéaire, mixte, multi-agents. Aucun cadre unique ne peut « le résoudre en un seul clic » - dans la pratique de l'ingénierie, il s'agit souvent d'une architecture hybride à plusieurs niveaux : la planification cartographique est utilisée au niveau stratégique, ORCA est utilisée au niveau tactique et APF est utilisé au niveau d'urgence, qui forment ensemble un système robuste de gestion du trafic aérien. --- **Principales références :**1. Karaman, S. et Frazzoli, E. (2011). *Algorithmes basés sur l'échantillonnage pour une planification de mouvement optimale.* International Journal of Robotics Research, 30(7), 846-894. 2. Van den Berg, J., Guy, SJ, Lin, M. et Manocha, D. (2011). *Évitement réciproque des collisions à n corps.* Robotics Research, 3–19. 3. Zeng, Y., Xu, J. et Zhang, R. (2019). *Minimisation de l'énergie pour la communication sans fil avec les drones à voilure tournante.* IEEE Transactions on Wireless Communications, 18(4), 2329-2345. 4. Mueller, MW, Hehn, M. et D'Andrea, R. (2015). *Une primitive de mouvement informatiquement efficace pour la génération de trajectoires de quadricoptères.* IEEE Transactions on Robotics, 31(6), 1294-1310. 5. Brittain, M. et Wei, P. (2019). *Contrôleur aérien autonome : une approche approfondie d'apprentissage par renforcement multi-agents.* arXiv :1905.01303. 6. Bertram, J. et Wei, P. (2020). *Guide informatique distribué pour la mobilité aérienne urbaine à haute densité.* AIAA Aviation Forum. 7. Valavanis, KP et Vachtsevanos, GJ (Eds.). (2015). *Manuel des véhicules aériens sans pilote.* Springer. 8. Auggliaro, F., Schoellig, AP et D'Andrea, R. (2012). *Génération de trajectoires sans collision pour une flotte de quadricoptères.* IEEE/RSJ IROS, 3977-3982.