論文C 研究計画:FIM-3DGS UAVアクティブセンシング計画
これは論文計画文書であり、技術的なチュートリアルではありません。 「FIM+3DGS+UAVアクティブセンシング」の方向性を文献調査から実験設計まで総合的に整理し、何ができるか、どこにギャップがあるのか、どのように書いて発信するかを検討して発信することが目標です。
0. なぜこれをしたいのですか?
UAV が都市の低高度でミッションを実行する場合、まず周囲環境の正確な 3 次元マップを確立する必要があります。これは、安全な飛行(障害物がどこにあるかを知る)のための前提条件であるだけでなく、その後のミッション計画(速達の最短経路、捜索救助ミッションのカバーエリア)の基礎でもあります。
既存のマッピング テクノロジーの 3 段階:
- クラシック マッピング (占有グリッド/点群): 成熟していて信頼性がありますが、解像度が限られており、微分不可能であり、エンドツーエンドの学習計画を直接推進することはできません。
- NeRF (2020 年以降): 再構成の品質は非常に高く、差分レンダリングが可能ですが、トレーニングには数分から数時間もかかり、リアルタイム飛行する UAV にはまったく使用できません。
- 3D ガウス スプラッティング (3DGS、2023 年以降): レンダリング速度 > 100 FPS、オンラインで段階的に更新でき、リアルタイム ロボット マッピングの新しい標準になりつつあります
3DGS は「リアルタイム」問題を解決しますが、次のような新たな問題も引き起こします。
核心的な矛盾: 3DGS をできるだけ早く高品質な再構成に収束させるために、限られた飛行予算 (時間/エネルギー消費/安全性) の中で最も価値のある撮影視点を積極的に選択するにはどうすればよいでしょうか?
これは **Next-Best-View (NBV) 能動認識 ** の問題です。プリセットされた軌道に従って受動的に飛行するのではなく、各ステップが「最も新しい情報を取得するには次にどこに飛行すればよいか」を能動的に決定します。
この質問がエンジニアリングにおいて重要な理由:
- 都市部の捜索救助では、UAV は閉じ込められた人の位置を特定するために 5 分以内に建物の 3 次元モデルを構築する必要があります。
- ドローンの電源検査では、最小飛行距離ですべての機器を網羅する高品質な視点が必要です。
- 低高度の物流計画では、高忠実度のマッピングが経路の安全マージンの正確な計算に影響します。
1. 関連作業の詳細なレビュー
1.1 NBV メソッドの 4 世代にわたる進化
第 1 世代: ジオメトリ NBV (2000 ~ 2018)
表面法線方向、錐台範囲の最大化、ボクセル占有予測などのヒューリスティック ルールに基づきます。表すもの: Connolly (1985) の基本的な NBV フレームワーク、Maver & Bajcsy (1993) のオクルージョン推論。利点は、計算が軽量であることです。欠点は、「情報」の数学的定義がなく、最適性が保証できないことです。第 2 世代: 情報理論 NBV (2018–2022)
シャノン相互情報量またはフィッシャー情報を使用して、「新しい視点がどれだけの新しい情報をもたらすことができるか」を定量化します。
- FCMI (ICRA 2020): 高速連続相互情報量、占有ボクセルの相互情報量の閉形式近似、1 Hz 未満のオンライン NBV を達成
- FSMI (IJRR 2021): リアルタイム SLAM のシャノン相互情報近似の高速化
この世代の手法には強固な理論的基盤がありますが、マップ表現は依然として粗粒の占有ボクセルであり、高精度の再構成には使用できません。
第 3 世代: ニューラル レンダリング NBV (2022–2023)
NBV 選択に NeRF 不確実性を使用する:
- ActiveNeRF (ECCV 2022、Ran et al.): NeRF 放射場のガウス不確実性モデルを構築し、最大の分散を持つ領域で NBV を駆動します。 「ニューラルレンダリング+能動知覚」のパラダイムの基礎を築きましたが、後に不可視領域の不確実性推定に盲点があることが指摘されました(NVFの発見)
- **NeU-NBV (IROS 2023、Jin et al.): ** 明示的なマッピングを使用せずに、LSTM ニューラル ネットワークを使用して将来のビューのレンダリングの不確実性を予測します。利点は、カメラの予算を効率的に使用できることです。欠点は、予測がブラックボックスであること、理論的な解釈ができないこと、トレーニング後に新しいシーンに移行することが難しいことです。
- **AutoNeRF (ICRA 2024、Marza et al.): ** 自律型データ収集により NeRF、最先端の探査 + モデル駆動戦略が推進され、パッシブ収集と比較して再構築の品質が 40% 以上向上します
この世代では、「能動的な知覚によりニューラル レンダリングの品質が向上する」という事実が確立されましたが、NeRF 自体のリアルタイム制限により、これらの方法の計画周波数は一般に 1 Hz 未満となり、実際の UAV アプリケーションとはかけ離れています。
第 4 世代: 3DGS NBV (2024–2025)
3DGS のリアルタイム レンダリングの性質 (>100 FPS) は、能動的な知覚の可能性の境界に革命をもたらします。- **ActiveGS (IEEE T-RO 2024、Ye et al.、arXiv: 2412.17769): ** ハイブリッド マップ (高密度 3DGS + 粗粒ボクセル)、「視点分布の均一性 + 方向性コサイン類似性 + 分散」に基づくガウス信頼スコア。初の完全な 3DGS アクティブ再構成システムですが、信頼スコアは厳密な理論的根拠のないヒューリスティックな設計です
- ActiveSplat (IEEE RA-L 2025): 階層型計画 + 統合されたマッピング/ビューポイント/計画フレームワーク、高いエンジニアリング整合性、および ActiveGS の拡張
- GauSS-MI (RSS 2025、Xie et al.): 各ガウスの確率モデルを構築し、視覚的な不確実性を定量化するためのシャノン相互情報量 (MI) を定義し、ミリ秒レベルのオンライン NBV スコアリングを達成します。 現時点でこの記事の作業に最も近い方法であり、最も直接的な競合となる方法
1.2 漁業者情報のアプリケーション追跡
Fisher Information Matrix (FIM) には、ロボット工学における応用の長い歴史があります。
- アクティブ SLAM (2005–): FIM (D 最適性基準) の決定要因を使用した姿勢推定の可観測性の最大化、Vallve & Andrade-Cetto (2015)
- FIT-SLAM (ICRA 2024、Saravanan et al.): 地上ロボット (UGV) によるアクティブ探査のために、FIM と地形通過可能性推定を結合します。主な制限事項: 地上ロボットのみ、3DGS なし、UAV ダイナミクスなし
- FisherRF (ECCV 2024 Oral、Jiang et al.): NeRF 視点選択に FIM を初めて導入し、拡張情報利得 (EIG) を最大化します。 これは、この記事の最も重要な直接の前触れです - 私たちの作業は、UAV ダイナミクスと安全性の制約を追加しながら、FisherRF を NeRF から 3DGS に移行することに相当します。
2025 年の新たな進歩: ICCV 2025 には、LLM セマンティック ガイダンスと FIM アクティブ マッピングを組み合わせた「マルチモーダル LLM ガイド付き探索とフィッシャー情報を使用したアクティブ マッピング」が含まれており、この分野をマルチモーダリティに拡張する最新のトレンドを表しています。### 1.3 主要文献比較表
| 方法 | 出版物 | 式 | 情報計測 | 無人航空機 | リアルタイムプランニング | 安全上の制約 | 理論的な下限 |
|---|---|---|---|---|---|---|---|
| アクティブネRF | ECCV 2022 | ネRF | レンダリングの差異 | ✗ | ✗ (<0.1 Hz) | ✗ | 弱い |
| NeU-NBV | イロス2023 | ネRF | LSTM 予測 | ✗ | ✗ (~1 Hz) | ✗ | ✗ |
| フィットスラム | ICRA 2024 | 占有率マップ | フィッシャー | ✗ (地面) | セクション | ✗ | ✓ |
| GENNBV | CVPR 2024 | 3DGS | RL 報酬 | ✗ | セクション | ✗ | ✗ |
| フィッシャーRF | ECCV 2024 | ネRF | フィッシャー | ✗ | ✗ | ✗ | ✓ |
| NVF | CVPR 2024 | ネRF | ベイズエントロピー | ✗ | ✗ | ✗ | 弱い |
| アクティブGS | T-RO 2024 | 3DGS | ヒューリスティック | パート | ✓ | ✗ | ✗ |
| ガウSS-MI | RSS2025 | 3DGS | ミシガン州シャノン | ✗ | ✓ (ミリ秒レベル) | ✗ | 弱い |
| FIM-3DGS (この記事) | ターゲット RA-L/ICRA | 3DGS | フィッシャー | ✓ | ✓ (<20 ミリ秒) | ✓ (CBF) | ✓ (CRB) |
主なギャップ (文献レビュー後に確認):
これまでのところ、以下の 4 点を同時に満たす論文はありません。 ① フィッシャー情報の厳密な理論的性質(CRB 下限) ② 3DGS のリアルタイム明示的表現 (>30 FPS レンダリング) ③ UAV 6-DoF 動的制約 ④ 障害物認識に基づく安全計画
この4点の組み合わせがこの記事の位置づけとなります。
2. 問題の正式な定義
2.1 システム設定環境: 未知の都市シーン 、初期マップは空です
UAV ステータス: 6-DoF ポーズ
センサー: 空中 RGBD カメラ、内部パラメータ
マップ表現: インクリメンタル 3D ガウス スプラッティング、パラメータ セット:
2.2 制約
動きの制約 (UAV ダイナミクス):
高さ制限 (低高度空域規制):
安全制約 (コントロールバリア機能 CBF):
2.3 最適化の目標
全体的な目標 (逐次最適化):
ここで、
大域最適は NP ハード (視点選択の非サブモジュール性) です。 シングルステップの貪欲戦略 を採用します (理論的には
このうち、
3. コアメソッド: FIM-3DGS フレームワーク
3.1 3DGS パラメータのフィッシャー情報行列
観測モデルから始める: 視点
加法ガウスノイズを仮定: 実際の観測値
パラメータ ベクトルのフィッシャー情報行列
ここで
グローバル FIM (すべてのガウス分布のブロック対角行列):
(異なるガウス分布のパラメーターが単一の観測内で条件付きで独立していると仮定すると、これは 3DGS のアルファ合成レンダリングにおける一次近似になります)
Cramér-Rao 下限 (理論的保証): パラメーター推定共分散の下限:
これが、GauSS-MI に対するこの記事の中心的な利点です。FIM の逆行列はパラメータ推定の不確実性の厳密な下限である。一方、シャノン エントロピーは情報量の上限にすぎず、理論的ステータスは異なります。
3.2 情報利得: D 最適性基準
FIM 行列式を最大化する次の視点を選択します (D 最適実験計画)。
D 最適化基準の物理的意味: パラメーター推定精度 (行列式 = パラメーター空間の「情報量」) を最大化します。
増分更新 (シュールの補数近似): 高次元行列の決定要因となる変化を直接計算するのは非常にコストがかかります。ウッドベリー恒等式の行列決定補題を使用します。
まばらなシーン (3DGS のガウス パラメーターはほとんどの視点で分離されている) の場合、上記の式は次のように簡略化できます。
直感的な説明: ガウス
3.3 軽量近似: リアルタイム コア
FIM を正確に計算するには、各ガウスのすべてのパラメータのヤコビアンを見つける必要があります。
観察: FIM のトレース ゲインは、ガウスのレンダリングの不確実性と高度に相関しています。各ガウスの 情報ギャップ スコアを定義します。
おおよその FIM ゲイン (GPU 並列、O(N)):
ここで、
理論上の誤差範囲:
計算複雑さの比較:|方法 |複雑さ | 10k ガウス時間 | 100k ガウス時間 | |------|--------|------|------| |正確な FIM | O(N·|P|·D²) | ~500ミリ秒 | ~5000ミリ秒 | | GauSS-MI(MCサンプリング) | O(N・S) | ~50ミリ秒 | ~500ミリ秒 | | RVP の近似 (この記事) | O(N) | <5 ミリ秒 | <20 ミリ秒 |
3.4 セキュリティを意識した NBV (CBF 制約)
現在の 3DGS から障害物エリアを抽出します。
このうち、
コントロールバリア機能 (CBF):
安全制約を伴う NBV の最適化 (SafeNBV):
安全性の保証 (理論的命題): UAV アクチュエータが一次制御制約を満たす (速度が制限されている) 場合、CBF 条件は、QP 投影を通じて軌道全体が
3.5 システムアーキテクチャ
FIM-3DGS システム全体は、並行して実行される 3 つのモジュールで構成されます。
┌─────────────────────────────────────────────────────────┐
│ 相机图像流 @ 30 Hz │
└──────────────┬──────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ Module 1: 增量 3DGS 更新(关键帧触发,~5 Hz) │
│ ├── COLMAP-free 位姿估计(ORB-SLAM3 前端) │
│ ├── 新关键帧:Gaussian 增密(opacity > 阈值的区域) │
│ └── 旧 Gaussian 剪枝(opacity → 0 的 Gaussian) │
└──────────────┬──────────────────────────────────────────┘
│ 更新 Θ_t
▼
┌─────────────────────────────────────────────────────────┐
│ Module 2: FIM 信息场计算(每步,~10 Hz) │
│ ├── 球面 Fibonacci 采样 500 个候选视点 │
│ ├── GPU 并行:RVP 近似评估 ΔĨ(v) for each v │
│ ├── CBF 安全过滤(剔除 h_CBF(v) < 0 的视点) │
│ └── 输出:最优视点 v*(含信息增益/距离比值最大) │
└──────────────┬──────────────────────────────────────────┘
│ v*
▼
┌─────────────────────────────────────────────────────────┐
│ Module 3: UAV 轨迹生成与执行(连续,~100 Hz) │
│ ├── RRT*:当前位置 → v* 的无碰撞轨迹 │
│ ├── MPC:跟踪轨迹(速度/加速度约束滚动优化) │
│ └── 在线重规划:如检测到新障碍物则触发重新规划 │
└─────────────────────────────────────────────────────────┘
4. 実験計画
4.1 シミュレーション プラットフォームの選択
| プラットフォーム | ポジショニング | 選定理由 |
|---|---|---|
| AirSim + アンリアル エンジン 5 | 主な実験プラットフォーム | 物理的に現実的な UAV ダイナミクス。 UE5 都市 3D モデルはグラウンド トゥルースとして直接使用できます。 ROS2 統合をサポート |
| アイザック シム (オムニバース) | ハードウェアインザループテスト | GPU アクセラレーションによる物理シミュレーション。 Jetson Orin 組み込みテスト。レイトレーシング |
| ガゼボ ハーモニック | ラピッドプロトタイピング | 軽量;アルゴリズム開発段階での迅速な反復に適しています。 |
AirSim シーン構成:
- 都市モデル: Unreal Engine Marketplace の「City Sample」 (Epic Games からの無料ライセンス、リアルな都市の峡谷)
- UAV 物理パラメータ: DJI Mavic 3 Pro (質量 895 g、最大速度 21 m/s、最大上昇速度 8 m/s)
- カメラ: RGBD 4K@30 fps、焦点距離 24 mm、深度範囲 0.5 ~ 40 m
- コンピューティング: NVIDIA RTX 3090 (シミュレーション レンダリング) + Jetson Orin NX 16G (オンボード アルゴリズム シミュレーション)
4.2 データセット|データセット |出典 |使い方 |スケール |
|------|------|------|------| | マトリックスシティ | ICCV 2023、香港 |都市型 UAV メインテストセット | 67 のルート、60,000 以上の画像、都市ブロック全体をカバー | | ScanNet v2 | CVPR 2017 |屋内迅速開発検証 | 1513 シーン、250 万フレーム | | 戦車と寺院 |シーグラフ アジア 2017 | SOTA との比較 |屋内と屋外を組み合わせた 21 のシーン | | BlendedMVS | CVPR 2020 |屋外汎化テスト | 113 シーン、17,000 枚の画像 | | AirSim オンライン自己収集 |この記事のシミュレーション生成 |アクティブ再構築オンラインクローズドループ実験 | 10の都市シーン×5回の繰り返し |
MatrixCity の重要なメモ: 2023 年に香港大学によってリリースされた、都市部の NeRF/3DGS 向けに特別に設計されています。これは現在、複数の UAV 視点ルートを含む唯一の大規模都市ニューラル レンダリング データ セットです。その 67 のルートにはすべてグラウンド トゥルース カメラのポーズがあり、次の用途に直接使用できます。
- オフライン評価 (指定されたカメラ軌跡、再構成品質の評価)
- オンラインアクティブ実験(シミュレーション環境のリプレイに基づく)
4.3 評価指標体系
復元品質 (コア):
プロアクティブな計画の効率性:
- **Coverage@N (%): ** 指定された
のフレーム バジェットで再構築によってカバーされる完全なシーン サーフェスの割合 - InfoGain Rate (nats/m): 単位飛行距離あたりの FIM 情報利得、探査効率の測定
- PSNR@budget 曲線: フライト フレーム数が増加するにつれて PSNR が上昇する曲線 (ベースラインとの面積の差が利点を定量化します)
セキュリティ:
- 衝突率 (%): 探査軌跡全体のうち、障害物から <
離れている割合 (目標: 0%) - 安全マージン (m): 最も近い障害物までの平均最小距離 (大きいほど良い)
計算効率:
- 計画レイテンシー (ミリ秒): シングルステップ NBV 決定時間 (目標: <20 ミリ秒)
- レンダリング FPS (Hz): 3DGS オンライン レンダリング フレーム レート (ターゲット: >30 Hz)
- GPU メモリ (GB): ピーク時のグラフィックス メモリ使用量 (目標: <8 GB)
4.4 ベースライン方法|ベースライン |オープンソースリンク |説明 |
|------|------|------| |ランダム |自己実装 |ランダムな実現可能な視点のサンプリング | |フロンティアベース |自己実装(3DGSに基づくフロンティア検出) |古典的な探索方法、強力な再現可能なベースライン | | フィッシャーRF | github.com/JiangWenPL/FisherRF | ECCV 2024、FIM+NeRF、公平な比較のために NeRF→3DGS を置き換え | | ガウSS-MI | github.com/JohannaXie/GauSS-MI | RSS 2025、最も直接的な競合相手 | | アクティブGS | github.com/Li-Yuetao/ActiveGS | T-RO 2024、ヒューリスティック 3DGS アクティブ再構築 | | GenNBV | github.com/zjwzcx/GenNBV | CVPR 2024、RL 戦略 NBV |
4.5 アブレーション実験計画|アブレーション用語 |バリエーション |検証の目的 |
|----------|------|----------| | CBF の安全制約を削除 | FIM-3DGS-NoSafe |衝突率と計画の品質に対する安全制約の影響を定量化する | | FIM をシャノン MI に置き換える | MI-3DGS | FIM とシャノン MI の理論的利点の定量的比較 (GauSS-MI との直接比較) | | NeRF を使用して 3DGS を置き換える | FIM-NeRF | 3DGSのリアルタイム表現の必要性を検証(FisherRFのアイデアを再現) | | RVP 近似を正確な FIM に置き換える | FIM-3DGS-正確 |近似誤差と計算速度のトレードオフ実験 | |情報なし/距離比 | FIM-3DGS-NoRatio |純粋に最大の情報獲得 (航空コストを考慮せず) |
4.6 期待される実験結果(仮説検証)
文献データと方法設計に基づいて、次の結果が推定されます (実験後に更新されます)。
| 指標 | ガウSS-MI (RSS’25) | FIM-3DGS(推定) | 期待されるメリット |
|---|---|---|---|
| PSNR @50 フレーム | ~24dB | ~25.5dB | +1.5dB |
| 50 フレームでのカバレッジ | ~75% | ~82% | +7% |
| レイテンシの計画 | ~30ミリ秒 | <20 ミリ秒 | 1.5 倍高速 |
| 衝突率 | 該当なし (安全機構なし) | 0% | — |
| GPUメモリ | ~6 GB | <8 GB | 許容される |
5. イノベーションに関する声明 (査読者向け)
**この論文は、都市 UAV アクティブ センシングのためのフィッシャー情報駆動型 3DGS 再構築システムである FIM-3DGS を提案します。 **
貢献 1 (理論)
3DGS 明示的プリミティブ パラメーターのフィッシャー情報行列の閉形式表現が初めて導出され、Cramér-Rao 下限との厳密な等価性が証明され、3DGS アクティブ再構成に情報理論の解釈可能性が提供されます。GauSS-MI (RSS 2025) とは異なるシャノンのエントロピー経験式:
- シャノンのエントロピーは情報量の上限であり、パラメーター推定の精度と直接の数学的関係はありません。
- FIM の逆行列は、パラメーター推定共分散の 厳密な下限 (CRB) であり、再構成されたパラメーターの識別可能性の程度を直接反映します。
- 理論的には、FIM 行列式 (D 最適化) を最大化することは、パラメーター推定ボリューム (楕円体ボリューム) を最小化することと同等ですが、シャノン エントロピーを最小化してもこの特性は保証できません。
投稿 2 (方法)
レンダリング分散プロキシ (RVP) 近似 は、正確な FIM 計算の
貢献 3 (システム)
初めて、FIM 情報ゲインと CBF 安全制約が UAV 6-DoF アクティブ プランニング フレームワークに統合されました。
都市部の峡谷シーンでの実験 (MatrixCity + AirSim シミュレーション) では、GauSS-MI (安全機構なし) と比較して、FIM-3DGS が衝突ゼロの安全制約の下でも PSNR ≥1.5 dB およびカバレッジ ≥7% を改善できることが証明され、安全性を意識した計画と高品質な再構築の両方を実現できることが検証されました。
6. GauSS-MI (RSS 2025) との大きな違い
これはレビュー担当者が尋ねなければならない質問です。「GauSS-MI は 3DGS の相互情報量を定義しました。あなたとそれの本質的な違いは何ですか?」
準備する必要がある標準的な回答:|寸法 |ガウSS-MI (RSS 2025) | FIM-3DGS(この記事) |
|------|--------------------------|----------------|
| 情報措置 |シャノンのエントロピー
中心的な議論: FIM とシャノン相互情報量は関連していますが、情報理論における同等の概念ではありません。パラメータ推定のコンテキストでは、FIM は統計的推定効率 (再構成精度に直接関係する) の尺度を提供し、シャノン エントロピーは確率分布のランダム性 (再構成精度に間接的に関係する) を測定します。この理論上の違いは、アブレーション実験 (MI-3DGS 対 FIM-3DGS) を通じて実験的に定量的に検証できます。
7. 提出戦略
対象ジャーナル/カンファレンス (優先度順)推奨: IEEE Robotics and Automation Letters (RA-L)
- インパクトファクター: 5.2 (2024)
- レビューサイクル: 2 ~ 3 か月 (高速)
- ページ制限: 8 ページ
- 利点: ActiveSplat (この記事で最も関連性のある作品の 1 つ) も RA-L で出版されており、査読者グループは正確です。 RA-Lではシミュレーション実験を承ります
同時提出: ICRA 2027
- 締め切り: 2026/09 頃 (提出は毎年 9 月頃)
- RA-L+ICRA 共同提出は標準動作です (提出は 1 件、承認後は ICRA で表示可能)
- 利点: ICRA は、露出度の高いロボット工学分野で最大のカンファレンスです。
代替: IROS 2026
- 期限: 2026/03 頃 (時間が迫っている、実験は 3 か月前までに完了する必要があります)
- 受け入れ率 ~40%、ICRA よりわずかに緩和 ・3月締切に間に合う場合は優先とさせていただきます。
ジャーナル拡張版: IEEE T-RO
- RA-L受理後、T-ROジャーナルバージョンに拡張可能(再提出、査読者の異動は不要)
- IF 7.4、SCI Q1、さらに実験を追加する必要がある (実機実験または大規模シミュレーション)
リスクの予測と対応を確認する
| 潜在的なレビュー コメント | 対処戦略 |
|---|---|
| 「GauSS-MIとの差が足りない」 | セクション 6 の表 + アブレーション実験 (MI-3DGS vs FIM-3DGS) を使用して違いを定量化します。 |
| 「RVP近似の理論的根拠が不十分」 | 補足近似誤差上限定理 (命題証明) + 実験検証誤差 <5% |
| 「シミュレーションのみで実機実験はなし」 | RA-L は純粋なシミュレーション実験を受け入れます。 AirSim の物理モデルは正確です。修正版提出時に屋内実機実験を補足可能 |
| 「都市部の峡谷のシーンは、十分に挑戦的ではありません」 | MatrixCity は、ICCV 2023 によって承認された大規模なデータセットです。複雑なオクルージョン シーンの定性的結果を補足する |
| 「安全制約が単純すぎる (CBF)」 | NBV 計画に安全制約が導入されたのはこれが初めてであることを強調します。単純さは重要ではないという意味ではなく、実験により衝突がゼロであることが証明されています。 |
8. 12か月実行ルート(ペーパーCスペシャル)
时间 任务 里程碑
────────────────────────────────────────────────────────────────────
2026/06 • 实现 FIM-3DGS 核心模块 ▶ 代码框架完成
• 3DGS 参数 Jacobian 推导与验证
• RVP 近似实现(GPU CUDA 内核)
2026/07 • AirSim + UE5 城市场景搭建 ▶ 仿真平台就绪
• 与 GauSS-MI / FisherRF 代码集成
• 在 ScanNet 上的初步验证实验
2026/08 • MatrixCity 离线实验(与所有基线对比) ▶ 实验数据完整
• AirSim 在线主动重建实验
• 消融实验全套(5 个变体)
2026/09 • 写稿(RA-L 格式,8 页) ◉ 投稿 RA-L + ICRA 2027
• 审稿人问题预演(Section 6 准备充分)
• 语言润色(英文检查)
2026/10 ─── 等待审稿(RA-L 约 2–3 个月)──────────────────────────
2026/12 • 收到审稿意见 ▶ 修改/接受
• 若需补充实验:准备真实机实验(室内场景)
2027/01 ◉ 修改稿提交(若大修) ▶ 目标:接受并在 ICRA 展示
────────────────────────────────────────────────────────────────────
付録: 参考文献リスト**引用する必要がある主要文書 (引用の優先順位で並べ替え):**1. FisherRF: Jiang W et al.、「FisherRF: フィッシャー情報を使用した放射フィールドによるアクティブ ビュー選択とマッピング」、ECCV 2024 (口頭)
- GauSS-MI: Xie Y 他、「GauSS-MI: アクティブ 3D 再構成のためのガウス スプラッティング シャノン相互情報」、RSS 2025
- ActiveGS: Ye Y 他、「ActiveGS: ガウス スプラッティングを使用したアクティブ シーン再構成」、IEEE T-RO 2024
- ActiveSplat: Li Y 他、「ActiveSplat: アクティブ ガウス スプラッティングによる高忠実度シーン再構成」、IEEE RA-L 2025
- 3DGS 原文: Kerbl B et al.、「リアルタイム ラディアンス フィールド レンダリングのための 3D ガウス スプラッティング」、ACM ToG 2023
- GenNBV: Chen X et al.、「GenNBV: アクティブ 3D 再構築のための一般化可能な次善のビュー ポリシー」、CVPR 2024
- NVF: Xue S et al.、「不確実性駆動型アクティブ マッピングのための神経可視化フィールド」、CVPR 2024
- ActiveNeRF: Ran Y et al.、「ActiveNeRF: Learning where to See with Uncertainty Estimation」、ECCV 2022 9。 NeU-NBV: Jin L 他、「NeU-NBV: 画像ベースのニューラル レンダリングにおける不確実性推定を使用した次善のビュー プランニング」、IROS 2023
- FIT-SLAM: Saravanan S et al.、「FIT-SLAM: Fisher Information and Traversabilityestimate-based Active SLAM」、ICRA 2024
- MatrixCity: Li Z 他、「MatrixCity: 都市レベルの新しいビューの合成と都市再構築のための大規模都市データセット」、ICCV 2023
- FCMI: Charrow B 他、「高密度 3D マッピングのための軌道最適化を使用した情報理論計画」、ICRA 2020
- CBF セキュリティ コントロール: Ames A 他、「コントロール バリア機能: 理論と応用」、ECC 2019---
ドキュメント バージョンに関する注意: これは Paper C プラン (
v1_20260515) の最初のバージョンです。その後の実験終了後、「v2_年月日.md」に更新され、レビューコメントをいただいた後、「v3_年月日.md」に更新されます。