都市低空 UAV ルート計画: マルチモーダル シミュレーション データ合成
NeurIPS/ICRA/IROS/TRO 2022-2025 の最新作業をカバーする、都市 UAV 計画におけるマルチモーダル データ合成およびシミュレーション プラットフォームのアプリケーションの概要
無人航空機マルチモーダルシミュレーションデータ合成シム2リアル強化学習
都市低空 UAV ルート計画: マルチモーダル シミュレーション データ合成
方向 5: マルチモーダル シミュレーション データの合成
拡張章・技術ブログ シリーズ パート 5
1. 背景: データ不足とセキュリティ制約という二重のジレンマ
都市部の低高度 UAV 計画アルゴリズム (特に深層強化学習に基づくプランナー) のトレーニングは、データ不足と安全性の制約という二重のジレンマに直面しています。
データ不足: 実際の飛行データを収集するコストは高くなります。多くの人員管理と現場のセキュリティが必要であり、複雑な都市シーンの特殊なケース (異常気象、突然の障害物、信号干渉) をシステムでカバーするのは困難です。パブリック データ セット (MAVNet、UZH-FPV など) は規模が限られており、エンドツーエンドの深層学習モデルのトレーニングをサポートすることが困難です。
安全性の制約: 強化学習プランナーは、トレーニングの初期段階で多くの「探索的」行動を生成します。本物の UAV を直接訓練すると、衝突や制御不能などの事故が発生する可能性があります。シミュレーション環境は ゼロリスクのトレーニング会場を提供しますが、シミュレーションと現実のギャップ (Sim2Real ギャップ) により、シミュレーションでトレーニングされた戦略は実際の UAV では完全に無効になります。
マルチモーダル シミュレーション データ合成は、時代の要求に応じて登場しました。これは、高忠実度のマルチセンサー シミュレーション環境を構築し、大規模で多様なトレーニング データを体系的に生成すると同時に、ドメイン ランダム化と Sim2Real 移行テクノロジーを使用してシミュレーションと現実の間のギャップを埋めることによって行われます。
2. マルチモーダルセンサーシミュレーション
2.1 マルチモーダリティが必要な理由
単一センサーには固有の機能限界があります。都市部の低高度 UAV を安全に運用するには、冗長センシング機能が必要です。
| センサー | コアコンピテンシー | 主な制限 | 補足事項 |
|---|
| RGB カメラ | テクスチャ認識、意味理解 | 夜間の失敗、深度情報なし | セマンティック セグメンテーション機能を提供する |
| ライダー | 正確な測距、3D マッピング | まばら、高コスト | 正確な形状を提供する |
| ミリ波レーダー | 全天候型の直接速度測定 | ノイズが多く、解像度が低い | 移動目標の検出を提供 |
| 熱画像処理 | 歩行者検知、ナイトビジョン | 温度差の曖昧性、低分解能 | 脆弱な道路利用者を検出する |
| 超音波 | 近距離での障害物回避 | 短距離、干渉を受けやすい | 正確な近距離知覚を提供します |
2.2 センサーシミュレーションの原理
RGB カメラ シミュレーション 物理ベース レンダリング (PBR) パイプラインに基づく:
ここで、 は双方向反射分布関数 (BRDF)、 は入射放射照度、PBR パイプラインは光とシーン マテリアルの物理的相互作用をシミュレートすることによってフォトリアリスティックな画像を生成します。 Unreal Engine 5 の Nanite 仮想ジオメトリ システムと Lumen グローバル イルミネーション システムは、現在、物理的現実に最も近いリアルタイム レンダリング ソリューションです。
LiDAR シミュレーションは通常、レイキャスティングに基づいています。つまり、各走査線方向に沿って LiDAR 位置から光線を放射し、シーンのジオメトリとの交差を検出し、距離と反射強度を返します。
はシーンが占有するジオメトリです。ハイエンド LiDAR シミュレーション (NVIDIA FLIPS など) では、マルチエコーや波形の広がりなどの物理的効果もシミュレートできます。
ミリ波レーダー シミュレーションは、電磁波伝播モデルに基づいて、信号のマルチパス効果 (マルチパス)、シャドウイング減衰 (シャドーイング)、および地面反射 (グラウンド バウンス) をシミュレートします。
\theta^* = \arg\max_\theta \mathbb{E}{\mathbf{s} \sim p\theta} \left[ \text{パフォーマンス}(\pi_\theta, \text{Real}) \right]
p_{\text{real}} \about \alpha \cdot p_{\text{sim}} + (1-\alpha) \cdot p_{\text{real,obs}}
\text{建物} ::= \text{基礎} + \text{床}^N + \text{屋根}, \quad N \sim \text{制服}(3, 30)
\text{FID} = |\mu_r - \mu_s|^2 + \text{Tr}\left( \Sigma_r + \Sigma_s - 2\sqrt{\Sigma_r \Sigma_s} \right)
r_t = r_{\text{進捗}} + r_{\text{安全性}} + r_{\text{効率}} + r_{\text{快適}}
$$- : 目標に向けた進捗に対するプラスの報酬
- 衝突の場合: 衝突ペナルティ (大きなマイナス報酬)
- : 時間ペナルティ (迅速な到着を促す)
- : 加速ペナルティ (急旋回の抑制)
7.2 シミュレーションから実際の移行戦略へ
ドメインのランダム化を行ったとしても、シミュレーションと実際のギャップが依然として存在する可能性があります。次の戦略により、移行の成功率を向上させることができます。
保守的な展開:
- まずは実機の低速・低空での安全性検証を実施
- 安全が確認されてから段階的に飛行範囲を拡大する
タスク関連の機能の調整:
- 実際のUAVのセンサーデータの特徴分布(深度統計、エッジ密度)を分析します。
- 主要な機能の分布に合わせてシミュレーション パラメータを調整します
メタ学習:
- MAML (Model-Agnostic Meta-Learning) を使用して、少量の実データに迅速に適応する戦略をトレーニングします。
- 基本ポリシー をシミュレーションでトレーニングし、実環境で に微調整します
7.3 仮想現実の閉ループのケース: アグレッシブ フライト
AlphaPilot (ロッキード マーティンが後援) と SUAS Competition の自律型 UAV レース プロジェクトは、成熟したシミュレーション、トレーニング、展開の閉ループを実証しています。1. Flightmare/AirSim で DOMAIN_RANDOMIZE を使用して、ランダムな照明、風の乱れ、障害物の位置を構成します
2. PPO を使用してエンドツーエンド戦略をトレーニングし (モーター速度を直接出力)、ラップタイム、衝突ペナルティ、快適性などの報酬が得られます。
3. トレーニング戦略はシミュレーションで の走査速度に達します
4. 実際の UAV にデプロイし、オンライン アダプテーションを使用して残りの Sim2Real ギャップを補正します。
5. 主要なスキル: セーフティ シールド - RL ポリシーの出力と幾何学的な計画に基づく緊急障害物回避を組み合わせることで、このポリシーはハイレベルの意思決定のみを担当します。
8. 今後の方向性とフロンティアの開拓
8.1 ニューラル シミュレーター: 学習可能な物理エンジン
従来のシミュレータは手動で設計された物理モデルに依存しており、複雑な相互作用 (流体と構造の相互作用、柔軟な物体の変形) を捉えることが困難です。 学習された物理エンジン (学習された物理エンジン) は、ニューラル ネットワークを通じてデータから物理法則を学習します。
グラフ ネットワーク シミュレーター (GNS) (Sanchez-Gonzalez et al.、ICML 2020) は、グラフ ニューラル ネットワークを使用して粒子システムの相互作用をモデル化し、流体、剛体、および多体システムの進化規則を学習できます。 GNS を空気力学モデリングに拡張すると、データ駆動型の UAV 飛行力学シミュレーション を実現できます。
8.2 インターネット規模のデータ + 生成 AI
大規模言語モデル (LLM) と拡散モデルは、シミュレーション データ生成に新しい可能性をもたらします。
- LLM がシーンの説明を生成:「北京 CBD 夕方のピーク交差点、車 5 台、歩行者 10 人」を入力、GPT-4V は詳細なシーン構成 (位置、速度、行動パターン) を生成できます
- 拡散モデル生成テクスチャ: ControlNet / Stable Diffusion を使用して、建築線画に基づいてリアルなテクスチャを自動的に生成し、手動モデリングを削減します。
- NeRF シーンのクローン作成: 携帯電話で 5 分間の都市ビデオを撮影し、それをナビゲーション可能な NeRF シーンに自動的に再構築し、シミュレーション環境として直接使用できます。
8.3 フェデレーテッド シミュレーション: 分散型協調マッピング将来的には、都市部の UAV クラスターが 連合シミュレーション ネットワークを形成する可能性があります。各 UAV は飛行中のデータを収集して都市の共有デジタル ツインを更新し、他の UAV は最新のツインをダウンロードして、更新されたシミュレーション環境でトレーニングします。これにより、データのプライバシーが保護される (元の画像がローカル領域から出ない) だけでなく、知識の分散蓄積も実現されます。
9. まとめ
マルチモーダル シミュレーション データ合成は、都市低空 UAV 計画アルゴリズムを研究から実装に移行するための重要な技術基盤です。高忠実度のセンサー シミュレーション (RGB、LiDAR、ミリ波、熱画像)、多様なシーン アセットのプログラムによる生成、および厳密なドメイン ランダム化戦略を通じて、大規模なトレーニング データ セットをシミュレーション環境で体系的に構築できます。
Sim2Real 移行の中心的な課題は、認識ギャップ と 動的ギャップ です。知覚のギャップは、ニューラル レンダリング (UniSim) と知覚の一貫性評価によって軽減できます。動的なギャップは、オンライン適応とメタ学習を通じて補うことができます。
ニューラル シミュレーター、学習可能な物理エンジン、生成 AI テクノロジーが成熟するにつれて、将来のシミュレーション データ合成はより自動化され、高忠実度で低コストになるでしょう。 Ground Truth としてのシミュレーション というビジョンが徐々に実現可能になりつつあります。
参考文献
※この記事は、都市低空ドローンルート計画に関するシリーズ記事の第5章の拡張版です。全シリーズ🎉*