Planification d'itinéraires urbains de drones à basse altitude : modélisation spatiale tridimensionnelle

Examiner systématiquement les méthodes de modélisation spatiale tridimensionnelle dans la planification d'itinéraires urbains de drones à basse altitude, couvrant la grille d'occupation 3D, l'effet canyon urbain et le modèle en couches de l'espace aérien.

##Présentation

La planification d’itinéraires urbains de drones à basse altitude est l’une des technologies de base de base pour parvenir à un transport aérien urbain sûr et efficace (UAM, Urban Air Mobility). Différent des zones ouvertes suburbaines, l’environnement urbain présente des caractéristiques distinctives telles qu’une structure géométrique tridimensionnelle complexe, une atténuation sévère des signaux GNSS et une forte perturbation du champ d’écoulement par les bâtiments, ce qui impose des exigences plus élevées aux méthodes de modélisation spatiale. Cet article se concentre sur la première partie de la série de planification d’itinéraires urbains à basse altitude pour les drones : la modélisation spatiale tridimensionnelle. Il aborde en profondeur la grille d’occupation tridimensionnelle (3D Occupancy Grid) et la représentation octree (Octree), la modélisation physique de l’effet canyon urbain (Urban Canyon) et le modèle hiérarchique de l’espace aérien qui s’appuie sur le contrôle aéronautique traditionnel, complété par une analyse comparative de la mise en œuvre de l’ingénierie.

1. Grille d’occupation tridimensionnelle et représentation octree

1.1 De deux dimensions à trois dimensions : définition mathématique

La grille d’occupation classique (Occupancy Grid) a été proposée par Moravec et Elfes (1985). Son idée principale est de discrétiser l’espace continu en grilles finies et de coder l’état d’occupation de chaque grille avec des valeurs de probabilité. Dans le cas bidimensionnel, l’espace est divisé en cellules carrées de longueur latérale , et la probabilité d’occupation de chaque cellule est enregistrée comme , où représente toutes les observations de capteurs jusqu’au temps . Les mises à jour des capteurs suivent la formule récursive bayésienne :

Dans l’ingénierie réelle, afin d’éviter le sous-débordement numérique et de simplifier les calculs, les cotes logarithmiques (log-odds) sont généralement exprimées :

Après chaque mesure du capteur, la règle de mise à jour additive est :

est déterminé par le modèle du capteur (positif lorsqu’il est occupé, négatif lorsqu’il est inactif). Cette méthode convertit la multiplication en addition, améliorant considérablement les performances en temps réel.La grille d’occupation tridimensionnelle étend la définition ci-dessus d’un plan à un espace volumétrique , divisant l’espace en unités cubiques (voxels) de longueur de bord . Supposons que représente le ème voxel, alors sa probabilité d’occupation est . La complexité de stockage direct des rasters tridimensionnels est de ( est le nombre de rasters unidimensionnels), ce qui est inacceptable dans les scénarios urbains typiques - par exemple, le nombre total de voxels couvrant une zone urbaine de ​​ à une résolution de atteint 10 au total.

1.2 Octree : Indice spatial pour une résolution adaptative

Octree est la solution standard pour relever les défis de stockage ci-dessus. La bibliothèque OctoMap proposée par Hornung et al. (2013) constitue une mise en œuvre marquante de cette méthode dans le domaine de la robotique. La logique de division spatiale de l’octree est la suivante : le nœud racine couvre tout l’espace tridimensionnel, et chaque nœud interne est subdivisé de manière récursive en 8 sous-nœuds de volume égal (correspondant à la division de l’espace tridimensionnel) jusqu’à ce que la profondeur maximale prédéfinie ou la taille minimale du voxel soit atteinte.

Supposons que la longueur du côté du nœud racine est et que la longueur du côté du voxel en profondeur est :

Le nombre maximum de nœuds pour la profondeur est de , mais comme l’octree ne divise que l’espace occupé ou observé, les zones inconnues/libres peuvent être représentées par un seul nœud, de sorte que le nombre réel de nœuds est beaucoup plus petit que le raster complet. Le modèle de stockage d’OctoMap utilise en outre Probabilistic OcTree : chaque nœud stocke une valeur de probabilité d’occupation , qui est continuellement modifiée via une mise à jour bayésienne. La probabilité d’un nœud inactif est , la probabilité d’un nœud occupé est proche de et le nœud correspondant dans la zone inconnue n’existe pas dans l’arbre (codage implicite).

Les expériences de Hornung et al. (2013) montrent que dans un environnement intérieur typique, la consommation de mémoire d’OctoMap est d’environ 1/50 de rasters tridimensionnels denses de même résolution, tout en prenant en charge les mises à jour dynamiques et les requêtes de résolution arbitraire.

1.3 Octree et perception multi-granularitéZeng et coll. (2020) ont proposé un algorithme de perception de l’environnement multi-granularité basé sur des grilles d’occupation octree sur des outils et applications multimédias, soulignant que bien que le modèle de nuage de points soit riche en informations, il existe une grande redondance dans la planification des chemins. Ils utilisent des octrees pour fournir une représentation probabiliste unifiée des données provenant de différents capteurs (RVB-D, LiDAR, etc.), en conservant les informations géométriques à haute résolution au niveau du nœud feuille et en fournissant une perception de la structure globale à basse résolution au niveau du nœud grossier. Cette idée est particulièrement importante pour la construction de cartes urbaines à grande échelle : un évitement d’obstacles au niveau centimétrique est nécessaire à courte distance, et une prise de décision macro-trajet au niveau de 100 mètres est nécessaire à distance.

Thomas et coll. (2021) ont en outre proposé des Cartes de grille d’occupation spatio-temporelle (SOGM) dans l’article arXiv (arXiv : 2108.10585), qui intègrent la prédiction temporelle des obstacles dynamiques dans la représentation de la grille, fournissant des capacités efficaces de prédiction d’occupation pour les personnes et les véhicules se déplaçant dans l’environnement urbain, et sont d’une grande valeur pour la planification d’évitement d’obstacles en temps réel.

2. Effet Canyon urbain : modélisation physique et défis de navigation

Urban Canyon fait référence à un micro-terrain urbain avec des bâtiments denses et des rues étroites. Il s’agit de l’un des environnements opérationnels les plus difficiles pour les drones à basse altitude. Ses effets physiques peuvent être compris en trois dimensions.

2.1 Atténuation du signal GNSS et effet multitrajet

Dans les canyons urbains, les immeubles de grande hauteur denses forment une structure de « canyon », et les signaux des satellites GNSS sont confrontés à deux types d’interférences graves :

L’ensemble de données UrbanNav (Wen et al., 2021 ; GitHub : IPNL-POLYU/UrbanNavDataset) a mesuré les performances de positionnement de capteurs à faible coût dans les canyons urbains de Tokyo et de Hong Kong. Les résultats ont montré que dans les zones de canyons profonds, l’erreur de positionnement d’un seul point (SPP) peut atteindre des dizaines de mètres. Même si un récepteur GNSS bi-fréquence est utilisé, sans détection et élimination NLOS, la précision du positionnement horizontal sera toujours difficile à répondre aux exigences inférieures au mètre pour la précision du vol stationnaire des drones. Le rapport hauteur/largeur (AR = hauteur du bâtiment / largeur de la rue) des canyons urbains est le facteur dominant affectant la précision du GNSS : plus l’AR est grand, plus la disponibilité du signal est faible.

2.2 Turbulences et perturbations du champ de ventLa dynamique des fluides au sein des canyons urbains présente un degré élevé d’hétérogénéité. L’étude classique de Rotach (1995) dans Boundary-Layer Meteorology a quantifié le profil statistique de la turbulence à l’intérieur des canyons, notant que l’énergie cinétique turbulente (TKE) dans les canyons de rue est 2 à 5 fois plus élevée que dans les banlieues ouvertes, et que l’écart type de la composante de vitesse verticale peut atteindre 0,3à fois la vitesse moyenne du vent près de la surface. Les principaux mécanismes physiques comprennent :

Pour la conception du contrôle des drones, la plage de fréquences caractéristique de l’intensité des turbulences est cruciale. La perturbation dans la bande de fréquence est la plus importante dans les canyons urbains, ce qui nécessite que la bande passante de la boucle d’attitude du système de commandes de vol ne soit pas inférieure à 20, ce qui n’est pas facile à mettre en œuvre sur une plateforme embarquée.

2.3 Effet d’accélération du vent de Bernoulli

Dans les rues étroites, l’effet Bernoulli ne peut être ignoré. Lorsque le flux d’air est forcé à travers un canal de section transversale réduite, la vitesse du vent augmente considérablement dans les zones locales selon l’équation de continuité . La vitesse du vent aux points les plus étroits entre les bâtiments dans les canyons urbains peut être 1,5 à 3 fois plus élevée que dans les zones ouvertes. De plus, « l’effet Venturi » entre les façades des bâtiments produira localement une succion vers le centre de la rue, menaçant la stabilité latérale du drone.

Dans la planification pratique, il est recommandé de modéliser la perturbation éolienne équivalente dans les canyons urbains sous forme de vent moyen superposé à des composantes de turbulence aléatoires  :

est un bruit blanc gaussien obéissant à la distribution normale standard, et est déterminé à partir d’une formule empirique basée sur le rapport d’aspect du canyon et la géométrie de la rue locale.## 3. Modèle en couches de l’espace aérien

3.1 Lumières issues du contrôle aéronautique traditionnel

Le système de contrôle du trafic aérien civil traditionnel a adopté la gestion des couches d’altitude (Altitude Layer) depuis des décennies : avec 1 000  (environ 300 ) comme intervalle d’altitude de base, l’espace aérien inférieur à 29 000  est divisé en plusieurs secteurs de contrôle, chaque couche desservant des avions de différents types et vitesses. Dans le contexte de l’UAM, les drones urbains à basse altitude doivent coexister avec les piétons au sol, les bâtiments, les aires d’atterrissage d’hélicoptères et les avions généraux traditionnels dans une plage verticale de **0à,\text{m} à 400). La conception en couches devient donc inévitable.

Les projets de recherche UTM (UAS Traffic Management) de la NASA (2016-2024) et UAM ConOps V2.0 de la FAA (2023) ont tous deux souligné que la gestion hiérarchique est le principal moyen d’éviter les conflits de drones à grande échelle. En s’appuyant sur cette idée dans des scénarios urbains, le schéma suivant à trois niveaux peut être conçu.

3.2 Schéma de division des couches de hauteur des scènes urbaines

Niveau d’altitudePlage verticaleFonctions principalesType d’avionVitesse typique
Étage GSol Livraison express sur les trottoirs, livraison robotiséeMicro multi-rotor
Niveau L30,\text{m}$Logistique communautaire, photographie aérienne urbaine, navette bassePetite aile multi-rotors/composite5,\text{m/s}$
Niveau U80,\text{m}$Intercity express, intervention d’urgence, navette en hauteurMoyen eVTOL/voile fixe15,\text{m/s}$

Remarque : les limites d’altitude spécifiques doivent être ajustées en fonction des réglementations locales de gestion de l’espace aérien (la Chine s’appuie sur les « Règlements provisoires sur la gestion des vols sans pilote » 2023) et de l’urbanisme.

Les principes de conception de ce schéma en couches sont les suivants :1. Isolement fonctionnel : la couche G se concentre sur la sécurité de la distribution des terminaux (pour éviter les conflits directs avec les personnes), la couche L est la couche d’application grand public urbaine et la couche U est proche de la hauteur de l’aviation générale traditionnelle pour être compatible avec la transition ; 2. Séparation des flux : les directions amont et aval sont en outre séparées horizontalement à la même altitude, et la boucle de route unidirectionnelle est conçue en référence à la logique d’approche à cinq côtés du contrôle de la circulation aérienne ; 3. Ajustement dynamique : la limite en couches peut être traduite dynamiquement en fonction de la densité du trafic en temps réel, et le cadre xTM (extensible Traffic Management) de la FAA a fourni une interface standardisée pour cela.

3.3 Fusion de cartes raster en couches et tridimensionnelles

Le modèle en couches de hauteur doit être profondément intégré à la grille d’occupation tridimensionnelle : lors de la phase de planification, le masquage des couches est effectué sur la carte octree en fonction des limites des couches, et les chemins ne sont recherchés que dans les voxels pilotables de la couche où se trouve la tâche actuelle et des couches adjacentes ; lors de la replanification dynamique, s’il y a une congestion sur une certaine couche, elle peut être automatiquement basculée vers la couche adjacente pour les détours. Ce mécanisme a été initialement vérifié dans le concept de corridor UTM (Corridor) de la NASA.

4. Compromis d’ingénierie pour les nuages de points/voxels Octree/PCL

Dans la pratique de l’ingénierie, le choix d’une méthode de représentation tridimensionnelle nécessite un compromis entre précision, mémoire, vitesse de calcul et fréquence de mise à jour. Ce qui suit est une comparaison systématique.| Métriques | Trame 3D dense | Octarbre | Nuage de points bruts (PCL) | Voxel de hachage | |------|------------|----------------|--------------|----------------------| | Efficacité de la mémoire | Faible (fixe ) | Élevé (fractionnement adaptatif) | Medium (uniquement les points enregistrés, pas de topologie) | Élevé (indice de hachage clairsemé) | | Complexité des requêtes | | | (exhaustif) ou (avec kd-tree) | signifie | | Mise à jour dynamique | Lent (reconstruction complète) | Rapide (séparation incrémentielle des nœuds) | Rapide (ajouter des points) | Rapide (insertion de hachage) | | Cohérence de la résolution | Cohérence mondiale | Adaptation hiérarchique | Aucune structure de grille | Cohérence mondiale | | Détection de collision | Rapide (index du tableau) | Moyen (recherche arborescente) | Lent (détection de modèle ponctuel) | Rapide (recherche de hachage) | | Écologie de l’ingénierie | ROS nav_msgs | OctoMap / PCL Octree | PCL/Open3D | OctoMap (configurable) | | Scénarios applicables | Petite portée et haute précision | Large gamme et résolutions multiples | Détection/cartographie en temps réel | Scènes clairsemées à grande échelle |

Le principal avantage d’Octree réside dans sa double caractéristique de résolution adaptative + représentation probabiliste : il s’agit à la fois d’une structure d’index spatial et d’un cadre de mise à jour probabiliste, particulièrement adapté aux besoins de perception des « obstacles précis à proximité et des obstacles rugueux au loin » dans les scènes urbaines. La bibliothèque OctoMap (Hornung et al., 2013 ; DOI : 10.1007/s10514-012-9321-0) témoigne de sa maturité en ingénierie, tant en termes d’activité sur GitHub que de nombre de citations académiques (plus de 5 000 fois selon Google Scholar).

L’avantage du nuage de points est qu’il préserve sans perte les données originales du capteur et convient aux algorithmes de perception basés sur le deep learning (détection de cibles 3D, segmentation sémantique, etc.) en entrée. La bibliothèque PCL (Point Cloud Library) et la bibliothèque Open3D fournissent une chaîne d’outils de traitement de nuages ​​de points mature, mais le nuage de points lui-même n’encode pas les informations sémantiques occupées/inactives et nécessite des étapes supplémentaires pour être converti en une zone pilotable.Les voxels de hachage (tels que le schéma d’index de hachage « OcTree Key » d’OctoMap) fonctionnent bien dans les scénarios qui nécessitent une vitesse de requête extrêmement rapide et des scènes clairsemées. La surcharge mémoire est proche de celle d’un octree mais la requête est plus efficace. C’est un sujet brûlant dans la recherche de pointe ces dernières années.

Dans les scénarios urbains réels, la solution recommandée utilise l’octree probabiliste d’OctoMap comme stockage sous-jacent, utilise le nuage de points d’origine comme entrée de détection, corrige en permanence la probabilité d’occupation via le mécanisme de mise à jour incrémentielle et utilise un index de hachage pour accélérer les requêtes du voisin le plus proche. Cette combinaison a été éprouvée dans les systèmes SLAM avancés tels que LIO-SAM pour obtenir une cartographie robuste en temps réel dans les canyons urbains (voir la version adaptée de LIO-SAM-6AXIS-UrbanNav).

5. Résumé et perspectives

Cet article trie systématiquement les éléments essentiels de la modélisation spatiale tridimensionnelle dans la planification d’itinéraires urbains de drones à basse altitude :

Les chapitres suivants aborderont progressivement des sujets tels que l’algorithme de planification de chemin (l’application d’algorithmes d’échantillonnage tels que RRT*/BIT* dans des cartes octree tridimensionnelles), l’optimisation de trajectoire en temps réel (modèle de contrôle prédictif sous perturbation du vent dans les canyons urbains) et l’évitement collaboratif d’obstacles multi-avions pour construire un système technologique complet de planification d’itinéraires urbains à basse altitude.


Références- Hornung, A., Wurm, KM, Bennewitz, M., Stachniss, C. et Burgard, W. (2013). OctoMap : Un cadre de cartographie 3D probabiliste efficace basé sur les octrees. Robots autonomes, 34(3), 189-206. https://doi.org/10.1007/s10514-012-9321-0