Planification d'itinéraires urbains de drones à basse altitude : synthèse de données de simulation multimodale
Aperçu de l'application des plateformes de synthèse et de simulation de données multimodales dans la planification urbaine des drones, couvrant les derniers travaux de NeurIPS/ICRA/IROS/TRO 2022-2025
droneSimulation multimodaleSynthèse des donnéesSim2Réelapprentissage par renforcement
Planification d’itinéraires urbains de drones à basse altitude : synthèse de données de simulation multimodale
Orientation 5 : Synthèse de données de simulation multimodale
Chapitre étendu · Série de blogs techniques, partie 5
1. Contexte : Le double dilemme de la rareté des données et des contraintes de sécurité
La formation des algorithmes de planification de drones urbains à basse altitude (en particulier les planificateurs basés sur l’apprentissage par renforcement profond) est confrontée au double dilemme de la rareté des données et des contraintes de sécurité :
Rareté des données : le coût de la collecte de données de vol réelles est élevé : cela nécessite beaucoup de main-d’œuvre, de contrôle et de sécurité du site, et les cas particuliers des scènes urbaines complexes (conditions météorologiques extrêmes, obstacles soudains, interférences de signal) sont difficiles à couvrir avec le système. Les ensembles de données publiques (tels que MAVNet, UZH-FPV) sont limités en échelle et difficiles à prendre en charge la formation de modèles d’apprentissage profond de bout en bout.
Contraintes de sécurité : Le planificateur d’apprentissage par renforcement produira de nombreux comportements « exploratoires » dans les premières étapes de la formation. Un entraînement direct sur de vrais drones peut entraîner des accidents tels que des collisions et des pertes de contrôle. L’environnement de simulation offre un lieu de formation à risque zéro, mais l’écart simulation-réalité (Sim2Real Gap) rend les stratégies entraînées dans la simulation complètement inefficaces sur le drone réel.
La synthèse de données de simulation multimodale a émergé au fur et à mesure que les temps l’exigeaient - en créant un environnement de simulation multicapteur haute fidélité, générant systématiquement des données de formation diverses et à grande échelle, tout en utilisant la randomisation de domaine et la technologie de migration Sim2Real pour combler le fossé entre la simulation et la réalité.
2. Simulation de capteurs multimodaux
2.1 Pourquoi la multimodalité est nécessaire
Il existe des limites de capacité inhérentes pour un seul capteur. L’exploitation sûre des drones urbains à basse altitude nécessite des capacités de détection redondantes :
Capteurs
Compétences de base
Limites clés
Complémentarités
Caméra RVB
Reconnaissance de textures, compréhension sémantique
Panne la nuit, aucune information sur la profondeur
Fournir des capacités de segmentation sémantique
LiDAR
Télémétrie précise, cartographie 3D
Rares et coûteux
Fournir une géométrie précise
Radar à ondes millimétriques
Mesure directe de la vitesse par tous temps
Bruyant, basse résolution
Fournir une détection de cible mobile
Imagerie thermique
Détection des piétons, vision nocturne
Ambiguïté de différence de température, basse résolution
Assurer la détection des usagers de la route vulnérables
Ultrasons
Évitement d’obstacles à courte portée
Courte portée, sensible aux interférences
Fournit une perception précise à courte distance
2.2 Principe de simulation de capteur
Simulation de caméra RVB Basée sur un pipeline de rendu physique (PBR) :
Où est la fonction de distribution de réflexion bidirectionnelle (BRDF), est l’irradiance incidente et le pipeline PBR génère des images photoréalistes en simulant l’interaction physique de la lumière et des matériaux de la scène. Le système de géométrie virtuelle Nanite et le système d’éclairage global Lumen d’Unreal Engine 5 sont actuellement les solutions de rendu en temps réel les plus proches de la réalité physique.
La simulation LiDAR est généralement basée sur le raycasting : émettre des rayons depuis la position LiDAR le long de chaque direction de ligne de balayage, détecter l’intersection avec la géométrie de la scène et renvoyer la distance et l’intensité de réflexion :
Où est la géométrie occupée par la scène. Les simulations LiDAR haut de gamme (telles que NVIDIA FLIPS) peuvent également simuler des effets physiques tels que le multi-écho et l’élargissement de la forme d’onde.
La simulation radar à ondes millimétriques est basée sur le modèle de propagation des ondes électromagnétiques pour simuler l’effet multitrajet (Multipath), l’atténuation d’ombrage (Shadowing) et la réflexion au sol (Ground Bounce) du signal :
r_t = r_{\text{progress}} + r_{\text{sécurité}} + r_{\text{efficacité}} + r_{\text{confort}}
$$- : récompense positive pour la progression vers l’objectif
si collision : pénalité de collision (grosse récompense négative)
: pénalité de temps (encourage l’arrivée rapide)
: pénalité d’accélération (supprime les virages serrés)
7.2 Simulation d’une stratégie de migration réelle
Même avec la randomisation de domaine, des écarts entre la simulation et la réalité peuvent encore exister. Les stratégies suivantes peuvent améliorer les taux de réussite de la migration :
Déploiement conservateur :
Effectuer d’abord une vérification de sécurité sur un vrai drone à basse vitesse et basse altitude
Élargir progressivement le domaine de vol seulement après que la sécurité soit confirmée
Alignement des fonctionnalités pertinentes pour les tâches :
Analyser la distribution des caractéristiques des données des capteurs (statistiques de profondeur, densité des bords) de drones réels
Ajuster les paramètres de simulation pour correspondre à la distribution des fonctionnalités clés
Méta-apprentissage :
Utiliser MAML (Model-Agnostic Meta-Learning) pour entraîner la stratégie afin de s’adapter rapidement à une petite quantité de données réelles
Entraîner la politique de base en simulation et l’affiner à dans l’environnement réel
7.3 Cas virtuel-réel en boucle fermée : vol agressif
Les projets de course de drones autonomes dans AlphaPilot (sponsorisé par Lockheed Martin) et SUAS Competition démontrent une boucle fermée de simulation-entraînement-déploiement mature :1. Utilisez DOMAIN_RANDOMIZE dans Flightmare/AirSim pour configurer l’éclairage aléatoire, les perturbations du vent et l’emplacement des obstacles
2. Utilisez PPO pour entraîner la stratégie de bout en bout (sortie directement de la vitesse du moteur), et les récompenses incluent le temps au tour, la pénalité de collision et le confort
3. La stratégie d’entraînement atteint une vitesse de déplacement de en simulation
4. Déployez sur un drone réel et utilisez l’adaptation en ligne pour compenser les lacunes résiduelles de Sim2Real.
5. Compétences clés : Bouclier de sécurité - Combinant les résultats de la politique RL avec l’évitement d’obstacles d’urgence basé sur une planification géométrique, la politique n’est responsable que de la prise de décision de haut niveau.
8. Orientations futures et exploration des frontières
8.1 Neural Simulator : moteur physique apprenable
Les simulateurs traditionnels s’appuient sur des modèles physiques conçus manuellement et sont difficiles à capturer des interactions complexes (interaction fluide-structure, déformation flexible du corps). Learned Physics Engine (Learned Physics Engine) apprend les lois physiques à partir de données via des réseaux de neurones :
Graph Network Simulator (GNS) (Sanchez-Gonzalez et al., ICML 2020) utilise des réseaux de neurones graphiques pour modéliser les interactions des systèmes de particules et peut apprendre les règles d’évolution des systèmes fluides, rigides et multi-corps. Si le GNS est étendu à la modélisation aérodynamique, il est possible de réaliser une simulation de la dynamique de vol des drones basée sur les données.
8.2 Données à l’échelle d’Internet + IA générative
Le modèle LLM (Large Language Model) et le modèle de diffusion offrent de nouvelles possibilités pour la génération de données de simulation :
LLM génère une description de la scène : saisissez « intersection de pointe du soir du CBD de Pékin, 5 voitures, 10 piétons », GPT-4V peut générer une configuration de scène détaillée (emplacement, vitesse, comportement)
Texture de génération de modèle de diffusion : utilisez ControlNet / Stable Diffusion pour générer automatiquement des textures réalistes basées sur des dessins au trait architecturaux, réduisant ainsi la modélisation manuelle
Clonage de scène NeRF : prenez une vidéo de ville de 5 minutes avec votre téléphone portable et reconstruisez-la automatiquement en une scène NeRF navigable, qui peut être utilisée directement comme environnement de simulation
8.3 Simulation fédérée : cartographie collaborative distribuéeÀ l’avenir, les clusters de drones urbains pourraient former un réseau de simulation fédéré : chaque drone collecte des données en vol et met à jour un jumeau numérique de ville partagé, et d’autres drones téléchargent le dernier jumeau et s’entraînent dans l’environnement de simulation mis à jour. Cela protège non seulement la confidentialité des données (l’image originale ne quitte pas la zone locale), mais permet également une accumulation distribuée de connaissances.
9. Résumé
La synthèse des données de simulation multimodale constitue la base technique clé permettant aux algorithmes de planification des drones urbains à basse altitude de passer de la recherche à la mise en œuvre. Grâce à la simulation de capteurs haute fidélité (RVB, LiDAR, ondes millimétriques, imagerie thermique), à la génération programmatique de divers actifs de scène et à une stratégie stricte de randomisation de domaine, des ensembles de données de formation à grande échelle peuvent être systématiquement construits dans l’environnement de simulation.
Le principal défi de la migration Sim2Real est le écart de perception et le écart dynamique. L’écart de perception peut être atténué grâce au rendu neuronal (UniSim) et à l’évaluation de la cohérence perceptuelle ; l’écart dynamique peut être compensé par l’adaptation en ligne et le méta-apprentissage.
À mesure que les simulateurs neuronaux, les moteurs physiques apprenables et les technologies d’IA générative mûriront, la future synthèse des données de simulation sera plus automatisée, plus fidèle et moins coûteuse. La vision de la Simulation comme vérité terrain devient progressivement possible.
Références
Shah, S., Dey, D., Lovett, C. et Kapoor, A. (2018). AirSim : Simulation visuelle et physique haute fidélité pour véhicules autonomes. Robotique de terrain et de service. https://doi.org/10.1007/978-3-319-67361-5_40
Song, Y., et al. (2023). Diffusion-LM : Génération de texte contrôlable via des modèles de diffusion. NeurIPS.- Griffith, S. et Boehm, J. (2023). SynthCity : Un nuage de points synthétiques à grande échelle pour les scènes urbaines. Journal ISPRS de photogrammétrie et de télédétection. https://doi.org/10.1016/j.isprsjprs.2023.04.015
Lois, C., et coll. (2020). Flightmare : Un simulateur quadrotor flexible avec une perception modulaire. IROS.
Cet article est le cinquième chapitre étendu d’une série d’articles sur la planification d’itinéraires urbains à basse altitude pour les drones. Série complète 🎉