Planification d'itinéraires urbains de drones à basse altitude : modélisation de l'espace aérien par jumeau numérique et rendu neuronal

Examen de l'application des jumeaux numériques et du rendu neuronal dans la modélisation de l'espace aérien urbain des drones, couvrant les derniers travaux de TRO/TITS/RAL/IROS 2022-2025

Planification d’itinéraires urbains de drones à basse altitude : modélisation de l’espace aérien par jumeau numérique et rendu neuronal

Troisième direction : jumeau numérique + modélisation de l’espace aérien par rendu neuronal Chapitre étendu · Série de blogs technologiques, partie 3


1. Contexte : les jumeaux numériques renforcent l’économie urbaine à basse altitude

Avec le développement rapide de la mobilité aérienne urbaine (UAM) et de l’économie à basse altitude, une gestion raffinée de l’espace aérien urbain à basse altitude est devenue un besoin essentiel. Les systèmes de contrôle du trafic aérien traditionnels s’appuient sur des cartes statiques et des systèmes basés sur des règles, qui ne peuvent pas répondre aux besoins de planification en temps réel des drones dans un environnement urbain tridimensionnel complexe. Digital Twin (Digital Twin), en tant que cartographie précise de l’espace physique dans le monde numérique, offre une nouvelle voie technique pour la modélisation dynamique de l’espace aérien urbain à basse altitude.

Les jumeaux numériques urbains à basse altitude doivent intégrer des données multi-sources : les images satellite fournissent une distribution macroscopique des objets en surface, les modèles d’informations du bâtiment (BIM) fournissent des structures géométriques fines et les données de capteurs en temps réel (LiDAR, caméras, stations météorologiques) pilotent l’évolution dynamique des jumeaux. La valeur fondamentale de la plateforme de jumeau numérique est de compléter la boucle fermée complète « prévision-planification-simulation-vérification » dans l’espace numérique, réduisant ainsi considérablement les risques et les coûts des essais en vol réels.

Cet article se concentre sur l’application de la technologie de rendu neuronal dans la modélisation numérique de l’espace aérien jumeau et explore comment construire une représentation tridimensionnelle haute fidélité et mise à jour en temps réel à basse altitude des villes grâce à des méthodes telles que NeRF/3DGS.


2. Bases de la modélisation numérique de l’espace aérien jumeau

2.1 Architecture du système de jumeau numérique de l’espace aérien

Les systèmes de jumeaux numériques urbains à basse altitude adoptent généralement une architecture à cinq couches :

NiveauFonctionTechnologie clé
Couche d’acquisition de donnéesFusion de données de détection multi-sourcesLiDAR SLAM, odométrie visuelle inertielle (VIO), télédétection par satellite
Couche de traitement des donnéesEnregistrement de nuages ​​de points, segmentation sémantiqueICP, PointNet++, segmentez n’importe quoi
Couche de modélisation 3DReconstruction géométrie/texture/sémantiquePhotogrammétrie, NeRF/3DGS, intégration BIM
Couche de déduction de simulationPrédiction de trajectoire, simulation de traficSimulation multi-agents, apprentissage par renforcement
Couche de service interactiveRequête de planification, interface APISystème d’information géographique (SIG), API RESTful

2.2 Cadre mathématique de la représentation du domaine aérien

En supposant que l’espace aérien urbain à basse altitude est (plage typique : ), l’état de l’espace aérien peut être modélisé comme un champ variable dans le temps :

Parmi eux :

La tâche principale du jumeau numérique est d’estimer et de mettre à jour ** en temps réel pour fournir à l’algorithme de planification l’état environnemental le plus précis à l’heure actuelle.


3. Application du rendu neuronal à la reconstruction spatiale

3.1 City-NeRF : Reconstruction neuronale de scènes urbaines à grande échelleCity-NeRF (Mueller et al., ACM ToG 2022) propose un cadre de rendu neuronal multi-vues pour les scènes à l’échelle urbaine, réalisant la reconstruction neuronale de scènes à grande échelle grâce à des stratégies de cartographie progressive et d’optimisation locale. Les conceptions principales de City-NeRF comprennent :

City-NeRF a vérifié les capacités de modélisation de la méthode de rendu neuronal pour les scènes 3D à grande échelle dans la scène des canyons urbains, mais la mise en œuvre initiale nécessitait des dizaines d’heures d’optimisation hors ligne et n’était pas en mesure de répondre aux besoins de planification en ligne des drones.

3.2 Modélisation de l’espace aérien en temps réel basée sur 3DGS

La nature de mise à jour incrémentielle de l’éclaboussure gaussienne 3D en fait un choix naturel pour la reconstruction dynamique de l’espace aérien des drones. Gaussian-Urban (l’idée est dérivée de l’extension d’application de 3DGS dans les scènes urbaines) modélise les bâtiments urbains, les arbres, les panneaux routiers et d’autres éléments de scène en tant que groupes gaussiens indépendants, prenant en charge l’insertion et la suppression incrémentielles image par image :

Les conceptions clés incluent :1. Gestion dynamique du cycle de vie gaussien : La zone nouvellement observée du drone génère une nouvelle gaussienne (opération fractionnée), et les gaussiennes redondantes qui n’ont pas été mises à jour depuis longtemps sont élaguées (élagage) 2. Gestion des morceaux : divisez la ville en blocs d’espace de 100 . Chaque bloc conserve un ensemble gaussien indépendant et le drone charge dynamiquement les blocs adjacents pendant le processus de mouvement. 3. Pipeline accéléré par GPU : utilisez CUDA pour implémenter la parallélisation GPU de la projection gaussienne, du tri en profondeur et de la synthèse alpha, atteignant une fréquence d’images de rendu mesurée de 15 FPS sur Jetson Orin

3.3 Intégration avec le modèle BIM/ville

Les méthodes de rendu neuronal purement basées sur les données présentent le problème d’une précision géométrique insuffisante : la géométrie apprise par MLP ou ensemble gaussien est un « rendu correct » plutôt qu’une « mesure précise », ce qui peut introduire des erreurs dangereuses dans les scénarios de planification qui nécessitent des limites de collision précises.

La solution de fusion neuro-géométrique est née :


4. Jumeau numérique dynamique de l’espace aérien : fusion et mise à jour des perceptions en temps réel

4.1 Modélisation d’éléments dynamiques

Il existe un grand nombre d’éléments dynamiques dans l’espace aérien urbain à basse altitude : autres drones en vol, oiseaux, cerfs-volants, levage de construction temporaire, etc. Les champs neuronaux statiques ne peuvent pas capturer ces cibles dynamiques, et une représentation spatio-temporelle en quatre dimensions (4D) doit être introduite.

Le cadre D-NeRF (Pumarola et al., NeurIPS 2021) introduit la dimension temporelle dans le champ de rayonnement neuronal, modélisé comme :$$ \mathcal{F}_\theta : (\mathbf{x}, t, \mathbf{d}) \rightarrow (\mathbf{c}, \sigma), \quad \mathbf{x}’ = \mathbf{x} + \Delta \mathbf{x}(t)

ùéééééé

\mathbf{P}t = \mathbf{F}\mathbf{P}{t-1}\mathbf{F}^\top + \mathbf{Q}, \quad \mathbf{Q} = \sigma_w^2 \mathbf{I}

You can't use 'macro parameter character #' in math mode ### 4.2 Fusion de détection multi-sources Un seul capteur ne peut pas fournir une connaissance complète de la situation de l’espace aérien. Les jumeaux numériques dynamiques de l’espace aérien doivent intégrer : | Capteurs | Avantages | Limites | Méthodes de fusion | |--------|------|------|---------| | **Caméra de vision** | Textures riches, faible coût | Panne de nuit/rétroéclairage, ambiguïté d'échelle | Profondeur de récupération SfM | | **LiDAR** | Portée précise, non affectée par l'éclairage | Rares et chers | Enregistrement de nuages ​​de points | | **Radar à ondes millimétriques** | Pénètre la brume et mesure directement la vitesse | Bruyant, basse résolution | Fusion avec vision/nuage de points laser | | **ADS-B** | Acquisition directe d'informations sur le trafic aérien | S'appuyer sur la diffusion de l'équipement de l'autre partie | Annotation de localisation | | **Tableau acoustique** | Détecter les sources sonores inconnues | Interféré par le bruit urbain | Localisation de sources sonores | **Champ neuronal en tant que centre de fusion multimodal** : chaque donnée de capteur est utilisée comme observation d'entrée du champ neuronal, et la densité et la distribution des couleurs du champ neuronal sont contraintes par l'équation de rendu du volume. Le principal avantage est que les champs neuronaux peuvent naturellement fusionner les données collectées par différents capteurs sous différents angles de vue et à différents moments** sans avoir besoin d'un enregistrement explicite de nuages ​​de points ou d'une correspondance de caractéristiques. ### 4.3 Pipeline de mise à jour en temps réel La conception du pipeline de mise à jour en temps réel du jumeau numérique dynamique de l’espace aérien est la suivante :1. **Collecte de données** : La caméra tournée vers l'avant et la caméra tournée vers le bas portées par le drone collectent en continu des séquences d'images. 2. **Estimation d'attitude** : obtenez la pose de la caméra grâce à l'odométrie visuelle inertielle (VIO) ou à la fusion GPS/IMU 3. **Cartographie incrémentielle** : transmettez les nouvelles observations dans l'optimiseur de champ neuronal et mettez à jour l'ensemble gaussien local ou les poids MLP 4. **Détection dynamique** : exécutez une segmentation sémantique sur chaque nouvelle image d'image pour séparer l'arrière-plan statique et le premier plan dynamique ; le premier plan dynamique est modélisé indépendamment comme un mouvement gaussien ou NeRF 4D 5. **Publication du statut** : publiez le statut actuel de l'espace aérien sur le planificateur via le sujet ROS 2 ou l'API WebSocket. **Indicateurs de performance clés** : latence de mise à jour de bout en bout $< 100\text{ms}$, couverture spatiale $> 95\%$ (par rapport à la zone du couloir de vol du drone), précision géométrique $> 10\text{cm}$ (@ $1\sigma$). --- ## 5. Planification de bout en bout : jumeau numérique → optimisation de trajectoire ### 5.1 Extraction sécurisée des couloirs L’extraction de corridors de sécurité à partir de représentations neuronales de l’espace aérien est une étape clé dans la connexion des jumeaux numériques à la planification de trajectoire. La méthode traditionnelle extrait la zone de délimitation de l'espace libre de la carte de voxels, mais une nouvelle méthode d'extraction est requise pour la représentation du champ neuronal : - **Détection de limite basée sur le gradient de densité** : Le gradient de densité du champ neuronal $\nabla_\mathbf{x}\sigma(\mathbf{x})$ est le plus grand à la surface de l'objet et peut être utilisé pour localiser la limite de collision - **Marching Cubes extrait les isosurfaces** : seuillez le champ de densité $\sigma(\mathbf{x})$ dans un champ d'occupation binaire et utilisez l'algorithme Marching Cubes pour extraire les isosurfaces comme limites de couloir sécurisées. - **Détection de collision basée sur gaussienne** : chaque ellipsoïde gaussien dans 3DGS peut calculer directement l'approximation SDF et n'a besoin de détecter les collisions avec l'ensemble gaussien que lors de la planification de la trajectoire. ### 5.2 Fonction objectif d'optimisation de trajectoire Conception de fonctions objectives pour l’optimisation de trajectoire dans un espace aérien jumeau numérique :$$ \min_{\mathbf{p}(t)} J = \underbrace{w_1 \int_0^T \|\mathbf{p}(t)\|^2 dt}_{\text{Lissage de trajectoire}} + \underbrace{w_2 \int_0^T \sigma(\mathbf{p}(t)) dt}_{\text{Évitement de collision}} + \underbrace{w_3 T}_{\text{Temps de vol}} + \underbrace{w_4 \sum_{i=1}^{N} \phi(d_i)}_{\text{Obstacles dynamiques}}

est la distance de l’obstacle dynamique , est la fonction potentielle exponentielle d’évitement d’obstacle.

Les entrées clés fournies par le jumeau numérique à ce problème d’optimisation sont : une estimation précise de et une prédiction de position en temps réel de .

5.3 Vérification et simulation

La plateforme de jumeau numérique permet une vérification sécurisée en simulation avant de déployer les trajectoires planifiées sur un drone réel :


6. Travaux associés et systèmes typiques

6.1 Plateforme de jumeaux numériques au niveau de la ville

AirSim City Twin (Microsoft, 2017) est l’une des premières plates-formes de simulation de drones open source, offrant un environnement urbain photoréaliste et prenant en charge la simulation de caméras RVB, LiDAR, IMU et autres capteurs. Le jumeau numérique d’AirSim est construit sur Unreal Engine et possède des textures réalistes mais une précision géométrique limitée.OnePlus City Digital Twin (inspiré de la recherche à grande échelle sur la reconstruction de scènes urbaines) utilise la méthode de fusion photogrammétrie + LiDAR pour créer des modèles de jumeaux numériques de plusieurs villes chinoises avec une résolution de 5  et prend en charge la planification urbaine et la simulation de drones.

NVIDIA Omniverse Replicator fournit une plate-forme unifiée pour la synthèse de données et la construction de jumeaux numériques, prenant en charge la représentation de scènes urbaines et l’accélération du rendu neuronal basée sur l’USD (Universal Scene Description).

6.2 Recherche sur la modélisation de l’espace aérien des drones

RechercheAnnéeMéthodologieCouvertureFréquence de mise à jour
Ville-NeRF2022NeRF multi-vuesBlocs de villeStatique
Gaussien-Urbain20233DGSNiveau de blocTemps réel
NGP instantané2022Encodage de hachageScène intérieure/petiteTemps réel
SUDS2023SLAM neuronalNiveau de la villeEn ligne
Décombres-Fusible2024Fusion multimodaleZone urbaineTemps quasi réel

7. Défis et orientations futures

7.1 Principaux défis actuels

Goulot d’étranglement des ressources informatiques : le jumeau numérique de l’espace aérien au niveau de la ville (10 ) contient des milliards de voxels/Gaussiens, dépassant de loin la puissance de calcul d’une seule carte. La stratégie de blocage apporte de nouveaux problèmes tels que le traitement des coutures entre les blocs et la planification de trajectoires entre blocs.

Contradiction entre rapidité et précision : l’optimisation du champ neuronal nécessite suffisamment de données d’observation pour converger, mais le statut de l’espace aérien urbain change rapidement (construction temporaire, contrôle des événements) et le jumeau numérique peut être à la traîne.

Cohérence multi-résolution : les exigences en matière de précision de l’espace aérien à différentes altitudes sont différentes : près du sol (0-30 ) nécessite une précision centimétrique pour éviter les obstacles, tandis que l’espace aérien à haute altitude (100-300 ) se concentre sur la connaissance de la situation. Il est difficile pour les méthodes de champ neuronal existantes de gérer uniformément les exigences multi-résolutions dans une seule représentation.

7.2 Orientation future du développementReprésentation hybride à géométrie neuronale : combinant les avantages des voxels/grilles explicites (requêtes géométriques efficaces) et des champs neuronaux implicites (photoréalisme) pour développer une représentation précise et belle de l’espace aérien urbain.

Grand modèle de langage + jumeau numérique de l’espace aérien : utilisez de grands modèles multimodaux tels que GPT-4V pour comprendre la sémantique de l’espace aérien et les règles de contrôle, et injectez des contraintes de langage naturel dans le système de planification du jumeau numérique pour réaliser une « planification du contrôle vocal ».

Mise à jour du jumeau numérique participatif : utilisez une grande quantité de données d’observation en temps réel provenant de drones pour distribuer et mettre à jour le jumeau numérique de la ville via l’apprentissage fédéré afin de réaliser une « cartographie participative ».


8. Résumé

Les jumeaux numériques fournissent la base numérique la plus haute fidélité, simulée et vérifiable pour la planification des drones urbains à basse altitude. La technologie de rendu neuronal améliore considérablement l’efficacité de la construction et le réalisme des jumeaux numériques de l’espace aérien grâce à une optimisation différenciable, des mises à jour incrémentielles et des capacités de fusion multimodale.

Cependant, il y a encore une distance entre le « modèle de ville statique » et le « jumeau dynamique en temps réel ». Les principaux défis résident dans la représentation efficace à grande échelle, la modélisation en temps réel d’éléments dynamiques et la cohérence multi-résolution. Avec les progrès continus de la technologie 3DGS, NeRF et des grands modèles de langage, les jumeaux numériques urbains à basse altitude devraient passer des prototypes de recherche au déploiement réel au cours des 3 à 5 prochaines années.


Références

-Qin, C., et al. (2022). Primitives graphiques neuronales instantanées avec un codage de hachage multirésolution. ACM SIGGRAPHE 2022.


*Cet article est le troisième chapitre étendu d’une série d’articles sur la planification d’itinéraires urbains de drones à basse altitude. *