低高度計画論文マトリックス v2: 3 つの論文が進行中、低高度および大規模モデルルートを具体化したフォローアップ
この記事は、これまでに書かれた低高度 UAV 論文を 論文ポートフォリオ に再統合します。
目標は、アイデアを広げたり、たくさん書いたりすることではなく、どの論文がすでに形になっているのか、どの論文が引き続きトップジャーナルや定期学会論文にできるのか、各論文にはどのような文献サポート、実験資産、投稿の位置づけが必要なのかを明確にすることです。
0. 2026-05-28 訂正結論
現在の焦点を変更する必要があります。「同時に 7 ~ 10 の論文を計画する」のではなく、すでに 3 つの論文に取り組んでいることをまず認識し、後続の論文はこれら 3 つの論文の資産から自然に成長する必要があります。
現在執筆中の記事は次の 3 つです。
|ステータス |記事 |役割 | |から逸脱できない主線 |---|---|---|---| |すでに取り組んでいます |論文 A: 紛争のない経路計画 / PPO-MAPPO / 低高度での紛争解決 |戦術的セキュリティ層 |高密度の低高度回廊、非協力的な UAV、通信/測位の低下、安全性と効率のトレードオフ | |すでに進行中 |論文 B: 100 台の UAV の 3 層階層スケジューリング |システム運用層 | 100 レベルのフリート、キューの安定性、バーティポート/充電/廊下のボトルネック、マルチモーダル スケジューリング | |すでに取り組んでいます |論文 C: 情報理論に基づく UAV 3DGS アクティブ センシング |環境認知層 | 3DGS / フィッシャー情報 / NBV / 安全な再構成 / 計画を意識したマッピング |
方向性と関係のない後続の論文のために、新しい論文を開始しないでください。正しいルートは次のとおりです。1. **まず、A/B/C を提出できる 3 つの主要な論文にします。 ** 2. フォローアップ ペーパー D/F/G/H/I は A/B/C の拡張としてのみ使用されます: シーン カバレッジは A/C をサポートし、低高度クラウド ブレインは A/B/C を直列に接続し、具体化された低高度は C の知覚と A の制御を閉ループに接続し、モデルの微調整と推論がサービス クラウド ブレインの実装を加速します。 3. 一般的な AGI 指示を空のクレームとして記述することはできません。より安定した表現は、「一般的な身体化された低高度インテリジェンスに向けて」です。ドメイン エージェント、ツールの呼び出し、シミュレーション フィードバック、VLA/VLN、ワールド モデル、およびデバイス側の推論から始まり、徐々に一般的な身体化されたインテリジェンスに近づきます。 4. 最初の段階で垂直基礎モデルを最初からトレーニングすることはお勧めできません。まず、通常の大規模モデル + エージェント + スキル/MCP + RAG + 検証者 + シミュレーターの後処理を使用して、再現可能な実験的な閉ループを形成します。 LoRA/SFT/DPO/GRPO の微調整を行う前に、十分なツール呼び出し軌跡、失敗サンプル、シミュレーション フィードバックが得られるまで待ってください。
これは、後続の論文を 2 つのレベルに分割する必要があることを意味します。
| レベル | 論文の目標 | 近い将来始めるかどうか |
|---|---|---|
| A/B/C メインレイヤー | すでに進行中であるため、実験的な閉ループを最初に完了する必要があります。すぐに | |
| Dシーンオーバーレイ | ベンチマーク、故障分類、および安全上重要なデータを A/C に提供します | 最近 |
| G クラウド ブレイン エージェント レイヤー | A/B/C/D/E を検証可能な低空交通クラウド ブレインを構築するツールに変える | 中期 |
| H 具現化低高度層 | UAV VLN/VLA/ワールドモデルを作成し、普遍的な身体化AIに接続 | 中期以降 |
| I モデルのトレーニング層 | トレーニング LowAltitudeGPT / ツールの使用 / LowAltitudeIR / シミュレーションのフィードバック | データが安定するまで待ちます |
| J推論加速層 | vLLM/TensorRT-LLM/量子化/デバイスとクラウドのコラボレーション/ハードウェア展開 | エージェントのワークロードが安定するまで待ちます |
1. 現在記事と本線の配置があります
現在、コンテンツの基礎を形成している 3 つの主要な記事があります。|番号 |既存のコンテンツ |現在の位置 |推奨される主な投資 |核心判断 | |---|---|---|---|---| |紙A |競合のない経路計画 / PPO / MAPPO / マルチ UAV 競合解決 |低空航空路ネットワークにおける確実な紛争解決 | IEEE T-ITS / IEEE T-RO / ICRA-IROS | PPO だけを書くことはできません。「非協力的な UAV、通信の低下、および高密度の通路の下での安全性と効率のトレードオフ」を書かなければなりません。 |紙B |数百の UAV 3 層ディスパッチング |都市低空物流・緊急システム運用派遣 | TR-C が先、T-ITS バックアップ |これは、輸送力、遅延、キューの安定性、回転ポート/充電/廊下のボトルネックに焦点を当てた交通システムの論文です。 |紙C |情報理論に基づいた UAV 3DGS アクティブセンシング計画 |アクティブ センシング + 低高度デジタル ツイン + 閉ループ計画 | T-RO / T-ITS / ICRA-IROS |交通ジャーナルに投稿する場合は、アクティブ センシングが検査、緊急事態、障害物回避、または運行制御指標を改善することを証明する必要があります。
これら 3 つの記事により、非常に安定した低空計画の三角形を形成することができました。
Paper A:战术安全
多 UAV conflict resolution / no-conflict planning / PPO-MAPPO / CBF / RMADER
Paper B:系统运营
hundred-UAV scheduling / queue stability / Lyapunov / multimodal logistics
Paper C:环境认知
3DGS active perception / Fisher information / NBV / safe reconstruction
その後の新しい論文は、完全に無関係な方向から始めるのではなく、この三角形を中心に展開することが最善です。
2. 提出全体の判断
低高度計画の方向性は論文の 3 つのカテゴリに分類でき、カテゴリが異なると審査基準も異なります。|タイプ |代表的な論文 |レビュー注意 |おすすめ会場 | |---|---|---|---| |交通システム関連論文 |論文 B、緊急資源割り当て、低空道路網計画 |実際の交通問題、システム指標、データ/シミュレーションの信頼性、ポリシーまたは運用への影響 | TR-C、T-ITS | |ロボット企画書 |ペーパー A、ペーパー C、デジタル ツイン計画 |アルゴリズムの新規性、リアルタイム、セキュリティ、ハードウェア/シミュレーションの検証 | T-RO、RA-L+ICRA/IROS、T-ITS | | AI手法に関する論文 | VERA-UAV、CloudBrain-Agent、シーンアクセラレーション生成 |ベンチマークの難易度、理論/検証メカニズム、モデルの一般化、再現性 | AAAI、IJCAI、NeurIPS/ICLR ワークショップ、T-ITS 拡張 |
TR-C の公式の位置づけでは、交通システムと新興技術が強調されており、知的中核は交通側にあります [1]。 T-ITS は、センシング、通信、制御、計画、設計、実装、およびその他の最新の交通システム技術をカバーしています [2]。したがって:
- 論文 B/緊急資源配分/低高度道路網計画: TR-C の交通システム運用ロジックに従って優先的に記述します。
- ペーパー A / ペーパー C: T-RO または ICRA/IROS に投票できます。 T-ITSに切り替える場合は、交通機関の指標を補完する必要があります。
- 論文 E/G タイプ LLM-Agent: 最初の論文は AAAI/IJCAI により適しており、ジャーナルのバージョンは T-ITS に拡張されています。
3. 論文マトリックス: 進行中の論文 3 件 + フォローアップ拡張ルート
このセクションの読み方は変更する必要があります。論文 A/B/C はすでに行われている 3 つの主要な作業であり、「将来の新しい方向性」ではありません。ペーパー D/E/G/H/I/J は書き込み可能な拡張機能ですが、起動シーケンスは A/B/C の実験的アセットの成熟度に従う必要があります。
3.1 論文 A: 低空航空路ネットワークの堅牢で紛争のない計画推奨トピック: 非協力的な交通と通信の低下下での堅牢で紛争のない UAV 回廊計画
既存の記事に対応します: 競合のないパス計画、PPO/MAPPO、UAV 競合解決、UAV 競合環境構築。
中心的な質問: 都市部の低空航空路ネットワークでは、現地観測、通信遅延、測位エラー、非協力的な航空機の挿入などの条件下で、複数の UAV が遅延、余分な距離、スループット損失を制御しながら分離の安全性を維持するにはどうすればよいでしょうか。
メソッドルート:
- 戦略層: ルート ネットワークに基づく初期パスとタイム スロットの割り当て。
- 戦術レイヤー: MAPPO/PPO 出力速度、高さ、または横方向のオフセット アクション。
- 安全シールド: CBF-QP / ORCA / RMADER スタイルの弾道チェック。
- フォールバック層: 通信が低下した場合、保守的な優先ルールに切り替えます。
- 評価: 30/50 機の航空機が訓練され、100/200 機の航空機がテストされ、協力、非協力、通信喪失、高密度回廊の 4 つのシナリオがカバーされます。
**主な参考資料:**MAPPO/PPO のマルチエージェントの安定したトレーニングは、Yu らによってサポートされます。 [3]; MAT と FACMAC は、より強力な MARL ベースラインを提供します [4,5]。 HAPPO/HATRPO は、信頼領域マルチエージェント ポリシー最適化リファレンス [6] を提供します。ロボット側では、EGO-Swarm、MADER、RMADER、RACER、PANTHER、GCOPTER がそれぞれ、分散型群計画、遅延下での軌道共有、共同探査、知覚を意識した計画、マルチコプター軌道最適化をサポートしています [7-12]。
イノベーションの提案:
- 「PPO コンフリクトフリー経路計画」を単純な RL タスクから低空交通通路の安全制御にアップグレードします。
- T-ITS がより懸念する実際の動作境界を形成するために、通信の低下と非協力的な UAV を導入します。
- 学習ポリシー + 形式/安全シールドを使用して、純粋な RL のセキュリティの欠如を回避します。
- 指標のトラフィック化: LoWC、NMAC、競合数、平均遅延、追加距離、スループット、ランタイム。
3.2 論文 B: 数百台の UAV の 3 層階層スケジューリング
推奨トピック: H-LyraUAV: 100 規模の低高度 UAV 物流のためのキュー安定階層スケジューリング
既存の記事に対応します: 論文 B の 3 層スケジュール計画。
中心的な質問: 動的な要件、限られたベルティポート / 充電 / 回廊容量、および複合輸送の制約の下で、100 レベルの UAV フリートをどのようにして安定、効率的、安全に運用できるか。
メソッドルート:- マクロ層: 需要キュー、フリートの再配置、モードの選択。
- メソ層: ベルティポート、充電パッド、コリドースロットのスケジューリング;
- マイクロレイヤー: エネルギー/安全/紛争を考慮した軌道の実現可能性。
- 理論: Lyapunov ドリフト プラス ペナルティは、キューの安定性とコストとバックログのトレードオフを保証します。
- データ: 合成都市グリッド + OSM/POI/NYC TLC/シカゴ タクシー/SUMO 強化。
主な参考資料:
TR-C 低高度 UAV 配送交通管理は、低高度都市空間におけるリソース割り当てと紛争解決について直接議論しています [13]。乗客中心の UAM、公平性および運用効率の研究サポート サービス品質の枠組み [14]。充電ステーション配送ネットワーク、容量に制約のある UAM スケジューリング、安全な学習スケジューリング サポート インフラストラクチャ容量と安全なオンライン スケジューリング [15-17]。トラック-ドローン / UAV-UGV マルチモーダル配送サポート マルチモーダル拡張 [18,19]。
**イノベーションの提案:**1. オフラインのルーティング/ネットワーク設計ではなく、百棚レベルのオンライン 3 層スケジューリング閉ループ。 2. キューの安定性が理論の本筋となり、学習モジュールは予測または値の推定のみを行います。 3. 遅延、スループット、バックログ、充電使用率、Vertiport のボトルネック、およびコリドーの混雑を同時に評価します。 4. 交通システムの結論は、いつトラフィックを制限する必要があるのか、ボトルネックはどこにあるのか、UAV のみがマルチモーダル フォールバックよりも劣るのはいつかということです。
3.3 論文 C: FIM-3DGS UAV アクティブ センシング計画
推奨トピック: FIM-3DGS: UAV の安全な再構築のためのフィッシャー情報駆動型のアクティブ知覚計画
既存の記事に対応します: 論文 C、Next-Best-View および NeRF/3DGS、情報理論アクティブ センシング。
中心的な質問: 限られた飛行時間、エネルギー、安全性の制約の下で、UAV はどのようにして積極的に視点を選択し、3DGS マップをより速く収束させ、低高度での計画タスクを実行できるでしょうか。
メソッドルート:
- シーン表現: インクリメンタル 3D ガウス スプラッティング。
- 情報メトリック: フィッシャー情報/ガウス パラメーターまたはレンダリングされたヤコビアンの予想情報ゲインを構築します。
- プランナー: NBV 候補の生成 + 安全な通路 / CBF 制約。
- タスク結合: 再構成の品質は、PSNR/SSIM だけでなく、障害物のリコール、計画衝突率、および検査範囲についても報告されます。
- ベースライン: ActiveNeRF、FisherRF、GS-Planner、HGS-Planner、POp-GS、フロンティア探索。
**主な参考資料:**オリジナルの 3DGS テキストは、リアルタイムの明示的な放射輝度フィールド表現を提供します [20]。 ActiveNeRF は、ニューラル レンダリングによる能動的な知覚の初期の代表的なものです [21]。 FisherRF は、フィッシャー情報のアクティブ ビュー選択を直接サポートし、3DGS バックエンド 70 fps の結果を備えています [22]。 GS-Planner、HGS-Planner、POp-GS、および NVF は、2024 年から 2025 年の 3DGS/NBV 競争ラインをサポートしています [23-26]。
イノベーションの提案:
- 「3DGS NBV」から「Active Perception Serving UAV Security Planning」にアップグレードします。
- フィッシャー情報を使用して、CRB / 再建の不確実性 / 計画の安全性を結び付けます。
- 視覚的な指標から交通/ロボットタスクの指標に拡張します: 経路実現可能性率、障害物再現率、緊急検査カバー率。
- MatrixCity/AirSim/自社構築の都市低空セルについて、シナリオを横断した一般化を行います。
3.4 論文 D: 低空の安全クリティカルシーンのカバーと加速テスト
推奨トピック: 安全性が重要な低高度 UAV ナビゲーションのためのカバレッジに基づく加速テスト
既存の記事との対応: ペーパー F シーンの取材、危険なシーンの生成、7,600 万件の探索ログ。
中心的な質問: 低高度 UAV 障害物回避/計画アルゴリズムのテスト シーン スペースを定義する方法、カバレッジを測定する方法、危険だが効果的な障害シナリオを効率的に発見する方法。
メソッドルート:- シナリオ文法: ローカル 50m x 50m x 50m セル、障害物の組み合わせ、動的障害物、風の乱れ、目標点、開始点と終了点。
- カバレッジメトリック: ジオメトリカバレッジ、セマンティックカバレッジ、ダイナミクスカバレッジ、リスクカバレッジ、障害モードカバレッジ。
- 加速テスト: カバレッジ ホールと障害の可能性から積極的にサンプリングします。
- 無効なフィルタリング: フィルタリングは非現実的、安全ではない、無効、実行不可能です。
- クロスプランナー評価: A*/RRT*/MPC/ORCA/MAPPO/CBF シールド プランナー。
主な参考資料:
Shuo Feng の NADE とテスト シナリオ ライブラリの生成は、加速テストとセキュリティ クリティカルなシナリオ ライブラリの中核となるリファレンスです [27-29]。 SafeBench は、ベンチマーク プラットフォームとセキュリティ評価プロトコルのリファレンスを提供します [30]。
イノベーションの提案:
- 自動運転シナリオ エンジニアリングから低高度 UAV 3D シーン空間に移行します。
- カバレッジ、重要性、実現可能性の 3 つの目標を同時にモデル化します。
- 7,600 万件の探索ログを使用して、カバレッジ スペースと障害分類を証明します。
- 結果から答えを導き出してみましょう: どの障害の組み合わせが最も危険なのか、プランナーはどの最悪を一般化しているのか、そしてカバー範囲の拡大が本当に未知のリスクを軽減するのかどうか。
3.5 論文 E: エラー修正 UAV 言語計画の検証
推奨トピック: VERA-UAV: 低高度 UAV タスクの検証と修復の言語計画
既存の記事に対応: 論文 E.
中心的な問題: LLM は自然言語タスクを UAV 実行可能なタスク仕様に変換できますが、実行不可能、セマンティクスの不一致、または安全制約に違反するプランが生成される傾向があります。型付き IR、LTL/STL、バリデータ、および反例のフィードバック ループが必要です。メソッドルート:
- NL 命令 -> 型付けされた TaskIR;
- タスクIR -> LTL/STL;
- スポット/RTAMT 検証;
- 反例/堅牢性フィードバック。
- ローカル LLM 反復修復。
- 最終的な軌道検証。
主な参考資料:
Lang2LTL、NL2LTL、LTLCodeGen、および ConformalNL2LTL はそれぞれ、NL から LTL へのグラウンディング、システム デモンストレーション、コード生成スタイルの時相論理生成、および等角正しさの保証をサポートしています [31-34]。
イノベーションの提案:
- NL2LTLだけでなく、UAVの軌道も閉ループを実行できます。
- 型付き TaskIR により、言語のあいまいさが軽減され、解釈可能性が向上します。
- 反例フィードバックと STL 堅牢性フィードバックにより、修復に特定の方向性が与えられます。
- AAAI/IJCAI バージョンは AI の計画/検証に焦点を当てています。 T-ITS は、低高度の交通運用シナリオに接続できるように拡張されています。
3.6 論文 G: 低高度交通雲脳 LLM エージェント
推奨トピック: CloudBrain-Agent: 低高度交通運用のためのツール拡張 LLM エージェント
既存の記事に対応: 論文 G/G1。
核心的な質問: 低高度交通クラウド ブレインは、単なるチャット モデルであることはできず、スケジューラー、経路計画者、検証者、シミュレーター、リスク評価者を呼び出すことができる検証可能なエージェントです。
メソッドルート:- LLM はタスクの理解、ツールの選択、ステータスの概要と解釈を担当します。
- ツールには、Paper A 競合リゾルバー、Paper B スケジューラー、Paper C アクティブ マッパー、Paper D シナリオ テスター、Paper E ベリファイアーが含まれます。
- 統一された中間表現としての LowAltitudeIR。
- 技術ルートは通常の大型モデル + エージェント + スキル + MCP/ツールの使用を優先し、後で LoRA/SFT の分野に焦点を当てます。
- 導入の第 1 段階では、API が呼び出されてベンチマークが形成され、第 2 段階では、ローカルの Qwen/DeepSeek モデルが再現とコスト管理に使用されます。
主な参考資料:
UrbanGPT、UniST、TrafficGPT は、交通/都市の時空間タスクが基礎モデルとエージェント フレームワークに近づき始めていることを示しています [35-37]。 DriveLM は自動運転ですが、その Graph VQA タスク フォームは、低高度交通クラウド ブレインの多段階推論から学習できます [38]。
イノベーションの提案:
- 低高度交通クラウド ブレインは「垂直チャット モデル」ではなく、ツールで強化された検証可能なエージェントです。
- 統合 IR を使用して、スケジューリング、計画、センシング、検証、シナリオ テストを接続します。
- 最初にエージェントのベンチマークを実行し、次に最初の記事のリスクを軽減するために垂直モデルを微調整するかどうかを決定します。
- 評価指標には、ツール呼び出しの精度、タスクの成功、安全違反、修復の成功、遅延、人間による監査可能性が含まれます。
3.7 論文 H: 都市低地 ODD とセマンティック機能エリア計画
推奨トピック: ODD2Route: 低高度 UAV ルート計画のためのセマンティック運用設計ドメイン モデリング
**これは新しい方向で書くことができる新しい記事です。 **
中心的な質問: 都市全体のシーンは、地域の低高度ルート計画にどのようにマッピングされますか?さまざまな機能分野、建物密度、道路構造、群衆の活動、飛行禁止区域、緊急施設の分布に基づいて、低空航空路のリスク、容量、サービス戦略をどのように決定するのでしょうか?メソッドルート:
- 都市レベルの ODD: OSM 道路/建物/POI/土地利用 + 人口/需要プロキシ。
- ローカル テスト セル: 都市 ODD からのローカル 3D 障害物/交通シナリオのサンプル。
- ルートリスクモデル: 建設中の峡谷、学校と病院、交通ハブ、高速道路セクション、飛行禁止区域。
- 計画出力: リスクを認識した回廊、高度レイヤー、緊急着陸場所、充電/バーチポートの候補。
- 評価: 都市間の一般化、単純な最短経路、リスク認識 A*、多目的 MILP、学習ベースのルート推奨機能の比較。
文献サポート:
この記事は、論文 B の TR-C/UAM 文献 [13-19]、論文 D のシナリオ カバレッジ文献 [27-30]、および論文 C の 3D/デジタル ツイン文献 [20-26] によって裏付けられています。問題はアルゴリズムの複雑さにあるのではなく、ローカル シナリオ/ルート リスクに対する都市レベルの ODD の信頼できる定義にあります。
イノベーションの提案:
- 「都市全体のシーン」と「局所的な障害物の組み合わせ」の間の計算可能なマッピングを確立します。
- シーンをランダムに生成するのではなく、ODD カバレッジを使用してシーン カバレッジを解釈します。
- 都市の低高度計画、ルート設計、および TR-C/T-ITS のテスト シナリオ ライブラリ間のブリッジを提供します。
3.8 論文 I: 具現化された低高度インテリジェンスと航空 VLA/VLN
推奨トピック: 身体化された低高度インテリジェンス: 都市空域における UAV の視覚、言語、行動計画
**これは、新しい調査後も維持する価値のある中長期的な方向性です。 **現在の身体化された知性の主流は、「LLM スピーキング」から「知覚、言語、行動を直接結び付ける VLM/VLA」に移行しました。 RT-2 は、視覚、言語、およびロボットの動作を同じモデル パラダイムに組み込んだ、視覚-言語-動作モデルを明確に提案しました [44]。 OpenVLA と Octo は、オープンソース VLA / ジェネラリスト ロボット ポリシーが大規模なロボットの軌道で事前トレーニングされ、その後、少量のターゲット ドメイン データで微調整できることを示しました [42,43]。 UAV の方向にも直接関連する研究が現れ始めています。SINGER は、ガウス スプラッティングを使用して、言語埋め込みフライト シミュレーション データを生成し、オンボード ドローン VLN ポリシーをトレーニングし、ハードウェア実験を行います [39]。 FlightGPT は SFT + GRPO を使用して UAV VLN を実行し、CityNav での一般化と解釈可能な推論を検証します [40]。 UAV-VLN は、自然言語、視覚認識、実行可能な軌道計画を結び付けます [41]。
書き込み可能なギャップ:
既存の航空VLN/VLAの多くは「言語ターゲットを与え、ドローンをターゲットの近くで飛行させる」ことに重点を置いています。これは、低高度の交通雲の脳に必要な能力ではありません。低高度シナリオでは、モデルが次のことを同時に理解する必要があります。
- 都市低空 ODD、空域構造、飛行禁止区域および危険区域。
- 複数の UAV の交通状況、通路の容量、および衝突回避ルール。
- 緊急作業、検査作業、物流作業の優先順位。
- 不完全なビジュアルマップ、測位エラー、通信の低下、および非協力的なターゲット。
- 出力は、エンドツーエンドのブラック ボックス操作ではなく、検証可能、制御可能、分解可能である必要があります。
推奨される方法:
multimodal observation
= UAV RGB/depth/semantic map/3DGS local map
+ low-altitude traffic state
+ natural-language mission
+ city ODD metadata
LLM/VLM/VLA policy
-> LowAltitudeIR
-> skill selection
-> waypoint / velocity / route command
-> verifier + safety shield
-> simulator or hardware feedback
最初に実行する推奨バージョン:
最初はエンドツーエンドの AerialVLA をトレーニングしないでください。まず、ハイブリッド具体化エージェントを作成します。
- 高レベルのマネージャーは、タスクの理解とツールの呼び出しに Qwen/DeepSeek/API モデルを使用します。
- 中間層は、ペーパー A の競合リゾルバー、ペーパー B のスケジューラー、ペーパー C のアクティブ マッパー、およびペーパー E のベリファイアーを呼び出します。
- 下位層は従来のコントローラー/MPC/CBF シールドを使用してリアルタイムのセキュリティを確保します。
- トレーニング データは、シミュレーション軌跡、専門プランナー、障害修復ログ、および手動の注釈タスクから取得されます。
利用可能なターゲット:- ICRA/IROS/T-RO: 具現化されたナビゲーション、ハードウェア閉ループ、およびシミュレーションからリアルへの強調に重点を置きます。
- AAAI/IJCAI: エージェントの計画、ツールの使用、検証のフィードバックを重視します。
- T-ITS: 低空での交通運用、緊急対応、紛争解決、システムインジケーターに重点を置きます。
3.9 論文 J: LowAltitudeGPT トレーニングとルートの微調整
推奨トピック: LowAltitudeGPT: 低高度交通インテリジェンスのためのツールの使用とシミュレーション フィードバックの調整
核となる判断:
今は「大規模な低空交通モデル」をゼロからトレーニングする時期ではありません。これには 3 つの問題があります。
- データの量が基礎モデルレベルの貢献をサポートするには不十分です。
- レビューでは、モデルの貢献度が通常の大規模モデル + RAG + ツールの使用を超えるかどうかが尋ねられます。
- トレーニング コストは高くなりますが、必ずしもエージェント/検証者/シミュレーターの閉ループよりも価値があるとは限りません。
より実現可能なルートは、通常の大規模モデル + エージェント + スキル/MCP + RAG + 検証者 + シミュレーター を最初に実行し、次に実行ログをトレーニング可能なデータに集約することです。 MCP は本質的に、ツールとコンテキストを LLM に公開する標準インターフェイスであり、スケジューラー、プランナー、検証者、シミュレーター、データベース、ドキュメント ライブラリへの統合アクセスに適しています [47]。
大規模な低高度経済モデルのレビューでは、低高度システムを施設ネットワーク、情報ネットワーク、ルートネットワーク、サービスネットワークに分類し、大規模モデルをエッジコンピューティング、6G/ISAC、および信頼できる分散インテリジェンスと組み合わせる必要があることを強調しています[50]。これは、私たちの論文が単に「チャット モデルのトレーニング」として書かれるのではなく、モデル、ツール、ネットワーク、操作制御、システム評価の閉ループとして書かれなければならないことを示しています。
| モデル選択の提案: | ステージ | おすすめモデル|理由 |
|---|---|---|
| ソリューション探索 / データ生成 / 教師 | 高機能 API モデル | 最終的な再現可能な依存関係として API を使用せずに、最初にタスク、ツール トレース、反例の説明、評価サンプルを迅速に生成します。 |
| ローカルで再現可能な実験 | クウェン3-8B / クウェン3-14B / クウェン3-32B | Qwen3 は、優れた中国語、ツール呼び出し、およびエンジニアリング エコロジーを使用して、ローカルの運用、展開、定量化、およびトレーニングのプロセスを正式にサポートしています [45] |
| 推論/数学/制約の解釈 | DeepSeek-R1-蒸留-Qwen-14B / 32B | DeepSeek-R1 シリーズは、RL に基づく推論機能を重視しています。 Distill バージョンはローカルにデプロイでき、Qwen/Llama オープン ソース モデルに基づいて微調整されています [46] |
| マルチモーダル低高度知覚 | Qwen-VL / Qwen3-VL / その他のオープンソース VLM | 写真、ビデオ フレーム、マップ、トラック チャート、および 3DGS レンダリングの意味的理解 |
| エッジエンド小型モデル | Qwen3-4B / 8B 定量版、SLM | エンドサイドのステータス概要、異常検出、低遅延フォールバックに使用 |
トレーニング データの設計:
| データ型 | 出典 | トレーニング目標 |
|---|---|---|
| NL ミッション -> LowAltitudeIR | マニュアルテンプレート + API 教師 + 実際のタスク書き換え | タスクの解析と構造化表現 |
| ツール使用トレース | 用紙 A/B/C/D/E ツール呼び出しログ | スケジューリング、計画、検証、シミュレーションを呼び出すタイミングを学ぶ |
| 検証者の反例 | スポット/RTAMT/CBF/シミュレーターのフィードバック | 実行不可能または危険な計画を修正する方法を学ぶ |
| シミュレーションのロールアウト | SUMO/AirSim/自社開発低空シミュレーション | 結果からシステムのボトルネックを説明する方法を学ぶ |
| 失敗例 | 衝突、LoWC、タイムアウト、キュー爆発、エネルギー消費不足 | リスク診断と緊急事態の緩和を学ぶ |
| 人間の監査データ | より合理的な解決策を手動で選択 | DPO/プリファレンスの最適化 |
**トレーニング段階:**1. RAG + プロンプト ベースライン: 微調整は行わず、文献ライブラリ、規制、システム記述、およびツール スキーマのみを使用します。 2. LoRA/QLoRA SFT: NL から IR へのトレーニング、ツール呼び出し、結果の解釈、および反例の修復。 3. DPO/IPO: 手動設定または検証者スコア設定を使用して、「安全、実行可能、簡潔、説明可能」を最適化します。 4. GRPO/RL スタイルのチューニング: シミュレーションを使用して、トレーニング タスクの成功率、低違反、低レイテンシー、およびフォーマットへの準拠を評価します。 FlightGPT の SFT + GRPO ルートは、UAV VLN リファレンスとして使用できます [40]。 5. 蒸留: API 教師/32B モデルの機能をローカルおよびエッジ展開用に 8B/4B に蒸留します。
評価指標:
-タスクの成功;
- LowAltitudeIR の正確な/意味論的な一致。
- ツール呼び出しの精度/リコール。
- 実行可能な計画レート。
- 安全違反率;
- 修復成功率;
- 幻覚率;
- レイテンシ/トークンコスト;
- 都市間/タスク間の一般化。
- 人間による監査の合格率。
3.10 論文 K: 低高度クラウドブレイン推論の高速化とソフトウェアとハードウェアのコラボレーション
推奨トピック: 低高度交通向けのエッジとクラウドの協調最適化推論 Cloud-Brain エージェント
**この記事が書ける理由:**将来的にソフトウェアとハードウェアの両方を実現したい場合、推論の高速化は単なるエンジニアリングの最適化ではありません。これは、低高度交通システムの制約下でのリアルタイム インテリジェント サービスの問題として記述する必要があります。クラウド側には大規模なモデルとグローバル ステートがあり、エッジ側には低遅延とプライバシー/通信の制約があり、ドローン側には電力消費、コンピューティング パワー、熱放散、リアルタイム制御の制約があります。汎用航空インテリジェント エージェントは、ハードウェアとソフトウェアの共同設計の方向に直接信号を与えています。搭載されている 14B モデルは、約 5 ~ 6 トークン/秒で実行され、ピーク消費電力は約 220 W で、低速 LLM 計画 + 高速反応制御の双方向認知アーキテクチャを採用しています [51]。
システムアーキテクチャ:
cloud brain
- full LLM / VLM
- global scheduler
- long-horizon planner
- batch simulation evaluator
edge station / vertiport
- quantized 8B/14B model
- local RAG cache
- route/conflict verifier
- streaming state summarizer
onboard UAV
- tiny policy / controller
- VIO / obstacle avoidance
- emergency fallback
- compressed semantic state uplink
加速するテクノロジー ルート:
- サーバー: vLLM/PagesAttendance/継続バッチ処理/プレフィックス キャッシュ。 PagedAttention の中心的な価値は、KV キャッシュの無駄を削減し、バッチ処理のスループットを向上させることです [48]。
- NVIDIA GPU プロダクション デプロイメント: TensorRT-LLM、TensorRT エンジン、Python/C++ ランタイム、および GPU 最適化を使用して LLM 推論を実行します [49]。
- エンド/エッジ: AWQ/GPTQ/GGUF INT4/INT8、KV キャッシュ圧縮、投機的デコード、小型モデル ルーター。
- ツール呼び出しの最適化: ツール スキーマのキャッシュ、静的 RAG 検索結果のキャッシュ、および高頻度のツール呼び出しを決定論的スキルにコンパイルします。
- オペレータの指示: アテンション カーネル、ページ化された KV キャッシュ、プレフィル/デコード分離、バッチ スケジューラ、MoE エキスパート ルーティング、ビジョン エンコーダ キャッシング。
**利用可能な論文のポイント:**1. システム ペーパー: 低高度クラウド ブレイン エージェント ワークロードのレイテンシ/コスト/エネルギー プロファイリング。 2. アルゴリズム システム ペーパー: タスクのリスクに基づいた API/クラウド 32B/エッジ 14B/オンボード 4B の動的選択。 3. オペレーター/推論論文: 複数のエージェント、複数のツール、長いコンテキスト、およびストリーミング ステータス更新による低空トラフィック向けの KV キャッシュとバッチ処理の最適化。 4. ハードウェア コラボレーション ペーパー: Jetson Orin / RTX ワークステーション / クラウド GPU の 3 層展開、トークン/秒、エンドツーエンドのレイテンシー、意思決定ごとのエネルギー、安全性フォールバック率を評価します。
推奨会場:
- 部分交通システム: T-ITS / IEEE IoT ジャーナル。
- 部分的なエッジ インテリジェンス: IEEE TMC / IEEE Internet of Things Journal / ACM TECS。
- 部分ロボットシステム: IROS/ICRA システム論文。
- 一部のオペレーターとシステム: MLSys / SC ワークショップ / DAC/DATE ワークショップから始めて、最初はトップ システム カンファレンスに直接行くことはお勧めしません。
4. 推奨の優先順位|優先順位 |記事 |最近のアクション |理由 |
|---|---|---|---| | P0-アクティブ |紙B |フリーズ問題の定式化、キュー モデル、実験的ベンチマーク | TR-Cシステム用紙に最も類似しており、低高度エコノミー・緊急時などに最適 | | P0-アクティブ |紙A | PPO/MAPPO を堅牢な低空紛争解決文書に書き直す |アルゴリズムの基礎はすでにありますが、トラフィック指標と強力なベースラインが必要です。 | P0-アクティブ |紙C | Fisher + 3DGS + 安全なプランニングに統合され、拡張しすぎなくなりました |アルゴリズムは革新的で、ロボット/AI/ITS で使用できます。 | P1サポート |ペーパーD | 7,600 万件の探索ログを再利用し、カバレッジに基づいたテストを実施 |安全性が重要なシナリオ、故障分類法、およびエアコンのベンチマークを提供します。 | P1ブリッジ |ペーパーG |最初にツールのインターフェースと CloudBrain-Agent ベンチマークを作成します |空のチャット モデルの代わりに、文字列 A/B/C/D/E を低空の雲の脳に挿入 | | P2 化 |論文 I |空中 VLN/VLA 小規模パイロットの作成: シミュレーション データ、専門家の軌道、エンドツーエンド/ハイブリッド戦略の比較 |これは、具現化された AGI につながる主要なラインですが、最初に A/C 認識とセキュリティ ツールを安定させる必要があります。 | P2モデル |ペーパーJ | LowAltitudeIR、ツール トレース、検証者のフィードバックを沈殿させ、LoRA/SFT/GRPO を実行します。まずデータの閉ループを用意し、次に垂直モデルを微調整します。 | P3システム |ペーパーK | CloudBrain-Agent ワークロードが修正されるまで待ってから、vLLM/TensorRT/量子化/エンドクラウド コラボレーションを実行してください。ソフトウェアとハードウェアの方向性を記述することはできますが、紙のように実際の作業負荷が必要です。 | P3-プランニング |ペーパーH | TR-C/T-ITS のその後の拡張として |成熟した都市データ パイプラインと ODD 定義が必要 |
**約定注文の提案:**1. 現在の主戦場を変更せず、A/B/C を継続して進めます。 2. 最初に論文 D を補足します。これは、A/C の実験の信頼性を直接高め、後続のモデル トレーニング データも生成できるためです。 3. Paper G を再度作成し、A/B/C/D/E をツールベースのクラウド ブレインにパッケージ化します。 4. Paper I/J/K 大きなプロジェクトを急いで始めないでください。最初に小さなパイロットとデータ スキーマを実行します。実際の質問を始める前に、データはどこから来たのか、評価指標は何なのか、そしてそれが通常の大規模モデル + ツール呼び出しよりも強力であるかどうかに答える必要があります。
4.1 文献サポート マトリックス
文書の積み重ねを避けるために、現在の 51 の参考文献は、紙の方向に従って閉じた方法で使用されます。|行き方 |ドキュメントグループ |使い方 | |---|---|---| |提出および輸送システムの位置付け | [1,2] | TR-C / T-ITS のフレーム構成の違いを確認する | |論文 A: マルチエージェントの競合解決 | [3-12] | PPO/MAPPO、MAT/FACMAC/HAPPO および EGO-Swarm/MADER/RMADER/RACER/PANTHER/GCOPTER ベースライン | |論文 B: 何百もの UAV のスケジューリング | [13-19] |低空配送リソース割り当て、UAM スケジューリング、安全学習、トラック-ドローン/UAV-UGV マルチモーダル配送 | |論文 C: 3DGS アクティブ センシング | [20-26] | 3DGS、ActiveNeRF、FisherRF、GS-Planner、HGS-Planner、POP-GS、NVF | |ペーパー D: セーフティクリティカルなシナリオの範囲 | [27-30] | Shuo Feng 加速テスト、シナリオ ライブラリ、SafeBench | |論文 E: 言語の計画と検証 | [31-34] | Lang2LTL、NL2LTL、LTLCodeGen、ConformalNL2LTL | |論文 G: 低高度雲脳エージェント | [35-38,47,50,51] | UrbanGPT/UniST/TrafficGPT/DriveLM、MCP、低高度経済大型モデルレビュー、航空インテリジェントエージェント | |論文 I: 具現化された低高度 / 空中 VLA | [39-44] | SINGER、FlightGPT、UAV-VLN、OpenVLA、Octo、RT-2 | |論文 J: モデルのトレーニングと微調整 | [40,45,46,47,50] | SFT/GRPO リファレンス、Qwen3、DeepSeek-R1、MCP/ツール使用、低高度大型モデルシステム測位 | |論文 K: 推論の高速化とソフトウェアとハードウェアのコラボレーション | [45,48,49,51] | Qwen3 デプロイメント エコロジー、vLLM/PagesAttendant、TensorRT-LLM、オンボード 14B 航空エージェント ハードウェア制約|---
5. Zotero がステータスを整理する
対象となるZoteroコレクション名:
低空规划论文参考
現在、次の 2 つのレベルの組織が完成しています。
| プロジェクト | ステータス |
|---|---|
| ゾテロコレクション | すでに存在します、コレクションキーは FVHS3SKY、ローカルツリービューIDはC17です |
| Zotero ローカル選択リンク | zotero://select/library/collections/FVHS3SKY |
| 輸入書類 | 51 のトップレベル項目 |
| 項目タイプの分布 | journalArticle 17 アイテム、conferencePaper 11 アイテム、document/preprint/webpage 23 アイテム |
| ローカルバックアップ BibTeX | zotero/low-altitude-planning-references-20260527.bib;増分: zotero/low-altitude-planning-references-update-20260528.bib |
インポート方法は、「zotero.sqlite」を直接記述する代わりに、Zotero のローカル コネクタ サーバーを使用します。具体的なプロセスは次のとおりです。
pandocを使用して、BibTeX が CSL JSON として解析できることを確認します。- Zotero ローカルの「/connector/import」を通じて「zotero/low-altitude-planning-references-20260527.bib」をインポートします。
- インポートされたセッションのターゲット コレクションを、「/connector/updateSession」を通じて「C17 / Low Altitude Planning Paper Reference」に更新します。
- Zotero ローカル API と読み取り専用 SQLite を使用して、コレクション内に 51 のトップレベル ドキュメントがあることを二重確認します。今後もドキュメントを追加し続ける場合は、まずローカル BibTeX を更新してから、同じコネクタのインポート/更新セッション プロセスを通じて Zotero をインポートすることをお勧めします。 SQLite を直接変更しないでください。
6. フォローアップの実行計画
6.1 第 1 週: 進行中の 3 つの論文を凍結する
- ペーパー A/B/C が現在アクティブなパイプラインであることは明らかであり、後続のペーパーは同じ優先度で書き込まれなくなります。
- ペーパー A: 紛争シナリオ、行動範囲、ベースライン、交通指標を凍結します。
- 論文 B: フローズン キュー モデル、リアプノフ対物レンズ、合成ベンチマーク、および TR-C フレーミング。
- ペーパー C: FIM/3DGS/NBV の理論的インターフェイスと計画を意識したメトリクスを凍結します。
- Zotero コレクションの初期インポートと 2026 年 5 月 28 日の増分インポートが完了しました。次のステップでは、各記事に PDF、要約メモ、優先タグを追加します。
6.2 第 2 ~ 3 週: 文献マトリックスの補足とその後のルートの新規性チェック
- 各主要記事について少なくとも 25 の関連性の高い文書を編集します。
- 各記事は、問題、方法、データ、指標、ギャップ、私たちの角度などの「関連作業マトリックス」を形成します。
- 論文 A/B/C について、「ベースラインを再現する必要がある」および「関連研究としてのみ機能する」論文にマークを付けます。
- Paper I/J/K のノベルティ チェックを個別に実行します。
- 論文 I: 航空 VLN、AerialVLA、SINGER、FlightGPT、OpenVLA、Octo、RT-2;
- 論文 J: Qwen3、DeepSeek-R1、ツール使用チューニング、MCP、RAG、シミュレーション フィードバック トレーニング。
- 論文 K: vLLM、TensorRT-LLM、定量化、KV キャッシュ、エッジクラウド展開。
6.3 週 4 ~ 8: 最初に Paper B/A/C の 3 つの実験ラインを進めます- ペーパー B: 合成 UAM キューイング ベンチマーク + FCFS/greedy/MILP/バックプレッシャー/MARL ベースライン。
- 論文 A: コリドー衝突シミュレーション + ORCA/CBF/RMADER/MAPPO ベースライン。
- 論文 C: 3DGS NBV パイプライン + FisherRF/ActiveNeRF/GS-Planner/POp-GS ベースライン。
- 論文 D: 軽いパイロットのみを作成し、7,600 万件の探索ログをカバレッジ/失敗分類に整理し、A/B/C リソースをめぐって競合しません。
6.4 第 9 ~ 12 週: 低高度雲脳の最小閉ループの構築
- A/B/C/D/E をツール インターフェイスとして公開します: スケジューラー、競合リゾルバー、アクティブ マッパー、シナリオ テスター、ベリファイアー。
- 「LowAltitudeIR」を定義して、ミッション、空域、UAV、リソース、リスク、およびツール呼び出しの結果を統合します。
- まず API 教師 + ローカル Qwen/DeepSeek を使用して CloudBrain-Agent のベースラインを作成し、急いで微調整しないでください。
- Paper J のトレーニング データとしてツール トレース、故障修復、シミュレーション ロールアウトを収集します。
6.5 第 13 ~ 20 週: 提出ルートとモデル ルートの決定- Paper B のキューの安定性と 100 シェルフ レベルの結果が最も安定している場合: 最初に TR-C に投票します。
- 論文 A が最も強い紛争安全性と一般化を持っている場合: 最初に T-ITS/T-RO に投票します。
- Paper C が Fisher + 3DGS の理論的および視覚的結果が最も強い場合: 最初に T-RO/ICRA/IROS に投票します。
- Paper D が最高のカバレッジ/障害発見データを持っている場合: 最初に T-ITS に投資します。
- CloudBrain-Agent がすでに A/B/C/D/E ツールを安定して呼び出すことができる場合: AAAI/IJCAI バージョンを開始します。
- 5k ~ 20k の高品質ツール トレース / 検証者フィードバック / シミュレーション ロールアウトが蓄積されている場合: LowAltitudeGPT LoRA/SFT を開始します。
- エージェントのワークロードが固定されており、レイテンシーがボトルネックになる場合: Paper K の vLLM/TensorRT/エッジ量子化実験を開始します。
7. 参考文献
[1] エルゼビア。 交通研究パート C: 新興テクノロジー: 目的と範囲 URL: https://www.sciencedirect.com/journal/transportation-research-part-c-emerging-technologies
[2] IEEE 高度交通システム協会。 高度道路交通システムに関する IEEE トランザクション: 範囲。 URL: https://ieee-itss.org/pub/t-its/[3] Chao Yu、Akash Velu、Eugene Vinitsky、Yu Wang、Alexandre M. Bayen、Yi Wu。 「マルチエージェント協力型ゲームにおける PPO の驚くべき効果」 神経情報処理システムの進歩、2022 年。URL: https://arxiv.org/abs/2103.01955
[4] Muning Wen、Jakub Grudzien Kuba、Runji Lin、Weinan Zhang、Ying Wen、Jun Wang、Yaodong Yang。 「マルチエージェント強化学習はシーケンス モデリング問題です。」 NeurIPS、2022 年。URL: https://proceedings.neurips.cc/paper_files/paper/2022/hash/69413f87e5a34897cd010ca698097d0a-Abstract-Conference.html
[5] ベイ・ペン、タビシュ・ラシッド、クリスチャン・シュレーダー・デ・ウィット、ピエール=アレクサンドル・カミエニー、フィリップ・トール、ヴェンデリン・ベーマー、シモン・ホワイトソン。 「FACMAC: 因数分解されたマルチエージェント集中型ポリシー勾配」。 NeurIPS、2021 年。URL: https://proceedings.neurips.cc/paper/2021/hash/65b9eea6e1cc6bb9f0cd2a47751a186f-Abstract.html[6] Jakub Grudzien Kuba、Ruiqing Chen、Muning Wen、Ying Wen、Fudan Sun、Jun Wang、Yaodong Yang。 「マルチエージェント強化学習における信頼領域ポリシーの最適化」。 arXiv:2109.11251、2021。URL: https://arxiv.org/abs/2109.11251
[7] 周博裕、周新、張俊、高飛、沈少傑。 「EGO-Swarm: 乱雑な環境における完全自律型の分散型クワドローター スウォーム システム」 ICRA、2021。DOI: 10.1109/ICRA48506.2021.9561902。 URL: https://arxiv.org/abs/2011.04183
[8] ヘスス・トルデシラス、ブレット・T・ロペス、ジョナサン・P・ハウ。 「MADER: マルチエージェントおよび動的環境における軌道プランナー」 IEEE Transactions on Robotics、38(1):463-476、2022。URL: https://arxiv.org/abs/2010.11061[9] 近藤康太、レイナルド・フィゲロア、フアン・ラチェド、ヘスス・トルデシラス、パーカー・C・ラスク、ジョナサン・P・ハウ。 「堅牢な MADER: 動的環境における通信遅延に強い分散型マルチエージェント軌道プランナー」 arXiv:2303.06222、2023。URL: https://arxiv.org/abs/2303.06222
[10] 周伯勇、徐郝、沈少傑。 「RACER: 分散型マルチ UAV システムによる迅速な共同探査」 ロボット工学に関する IEEE トランザクション、2023 年。DOI: 10.1109/TRO.2023.3236945。 URL: https://arxiv.org/abs/2209.08533
[11] ヘスス・トルデシリャスとジョナサン・P・ハウ。 「PANTHER: 動的環境における知覚を意識した軌道プランナー」 IEEE Access、10:22662-22677、2022。DOI: 10.1109/ACCESS.2022.3154037。 URL: https://arxiv.org/abs/2103.06372[12] Zhepei Wang、Xin Zhou、Chao Xu、Fei Gao。 「マルチコプターの幾何学的拘束軌道の最適化」。 IEEE Transactions on Robotics、38(5):3259-3278、2022。DOI: 10.1109/TRO.2022.3160022。 URL: https://arxiv.org/abs/2103.00190
[13] アン・リー、マーク・ハンセン、ボー・ゾウ。 「低高度都市空間における UAV ベースの小包配達のための交通管理とリソース割り当て」 交通研究パート C: 新興技術、143:103808、2022。DOI: 10.1016/j.trc.2022.103808。 URL: https://doi.org/10.1016/j.trc.2022.103808
[14] メディ・ベナソー、レミ・デルマス、ユセフ・ハマディ。 「乗客中心の都市航空モビリティ: 公平性のトレードオフと運用効率」。 交通研究パート C: 新興技術、136:103519、2022。DOI: 10.1016/j.trc.2021.103519。 URL: https://doi.org/10.1016/j.trc.2021.103519[15] ロベルト・ピントとアレクサンドラ・ラゴリオ。 「中間充電ステーションを備えたポイントツーポイントのドローンベースの配送ネットワーク設計」 交通研究パート C: 新興技術、135:103506、2022。DOI: 10.1016/j.trc.2021.103506。 URL: https://doi.org/10.1016/j.trc.2021.103506
[16] ウェイ・チンシュアン、グスタフ・ニルソン、サミュエル・クーガン。 「輸送能力に制約のある都市部の航空モビリティのスケジューリング」。 arXiv:2107.02900、2021。URL: https://arxiv.org/abs/2107.02900
[17] スーリヤ・ムルティ、ナターシャ・A・ネオギ、スダ・バラドワジ。 「安全な学習を使用した都市部の航空モビリティのスケジューリング」。 arXiv:2209.15457、NASA NTRS、2022。URL: https://arxiv.org/abs/2209.15457[18] Jiahao Xing、Tong Guo、Lu Tong。 「動的同期による信頼性の高いトラックとドローンのルーティング: 高次元ネットワーク プログラミング アプローチ」 交通研究パート C: 新興技術、165:104698、2024。DOI: 10.1016/j.trc.2024.104698。 URL: https://doi.org/10.1016/j.trc.2024.104698
[19] 周伯龍、魏曾、海楊。 「リリース時間を考慮したマルチトリップ UAV-UGV 配信ネットワーク設計」。 交通研究パート C: 新興技術、181:105389、2025。DOI: 10.1016/j.trc.2025.105389。 URL: https://doi.org/10.1016/j.trc.2025.105389
[20] ベルンハルト・ケルブル、ゲオルギオス・コパナス、トーマス・ライムキューラー、ジョージ・ドレッタキス。 「リアルタイム ラディアンス フィールド レンダリングのための 3D ガウス スプラッティング」。 ACM Transactions on Graphics / SIGGRAPH、42(4)、2023。DOI: 10.1145/3592433。 URL: https://arxiv.org/abs/2308.04079[21] Xuran Pan、Zihang Lai、Shiji Song、Gao Huang。 「ActiveNeRF: 不確実性推定でどこを見るべきかを学習する」。 ECCV、2022 年。URL: https://arxiv.org/abs/2209.08546
[22] ウェン・ジャン、ボシュ・レイ、コスタス・ダニリディス。 「FisherRF: フィッシャー情報を使用したアクティブ ビューの選択と放射フィールドによるマッピング」 ECCV、2024。DOI: 10.1007/978-3-031-72624-8_24。 URL: https://eccv.ecva.net/virtual/2024/oral/1226
[23] Rui Jin、Yuman Gao、Yingjian Wang、Haojian Lu、Fei Gao。 「GS-Planner: アクティブな高忠実度再構築のためのガウス スプラッティング ベースの計画フレームワーク」 arXiv:2405.10142、2024。URL: https://arxiv.org/abs/2405.10142
[24] Zijun Xu、Rui Jin、Ke Wu、Yi Zhao、Zhiwei Zhang、Jieru Zhao、Fei Gao、Zhongxue Gan、Wenchao Ding。 「HGS-Planner: 3D ガウス スプラッティングを使用したアクティブ シーン再構築のための階層的プランニング フレームワーク」 arXiv:2409.17624、2024。URL: https://arxiv.org/abs/2409.17624[25] Joey Wilson、Marcelino Almeida、Sachit Mahajan、Martin Labrie、Maani Ghaffari、Omid Ghasemalizadeh、Min Sun、Cheng-Hao Kuo、Arnab Sen。「POp-GS: P 最適化による 3D ガウス スプラッティングの次善のビュー」。 CVPR、2025 年。URL: https://cvpr.thecvf.com/virtual/2025/poster/34708
[26] Shanjie Xue、Jesse Dill、Pranay Mathur、Frank Dellaert、Panagiotis Tsiotras、Danfei Xu。 「不確実性駆動型アクティブマッピングのための神経可視フィールド」 CVPR、2024 年。URL: https://arxiv.org/abs/2406.06948
[27] Shuo Feng、Xintao Yan、Haowei Sun、Yiheng Feng、および Henry X. Liu。 「自然主義的環境と敵対的環境を備えた自動運転車のインテリジェント運転知能テスト」 Nature Communications、12:748、2021。DOI: 10.1038/s41467-021-21007-8。 URL: https://www.nature.com/articles/s41467-021-21007-8[28] Shuo Feng、Yiheng Feng、Chao Yu、Yi Zhang、Henry X. Liu。 「コネクテッド車両および自動化車両のテスト シナリオ ライブラリの生成、パート I: 方法論」。 高度道路交通システムに関する IEEE トランザクション、2021 年。DOI: 10.1109/TITS.2020.2972211。 URL: https://doi.org/10.1109/TITS.2020.2972211
[29] Shuo Feng、Yiheng Feng、Haowei Sun、Yi Zhang、Henry X. Liu。 「コネクテッド車両および自動運転車両のテスト シナリオ ライブラリ生成、パート II: ケース スタディ」。 高度道路交通システムに関する IEEE トランザクション、2021 年。DOI: 10.1109/TITS.2020.2988309。 URL: https://doi.org/10.1109/TITS.2020.2988309[30] Chejian Xu、Wenhao Ding、Baiming Li、Xinqing Chen、Ding Zhao、Bo Li、Jiajun Liu、Hang Zhao。 「SafeBench: 自動運転車の安全性評価のためのベンチマーク プラットフォーム」 NeurIPS データセットとベンチマーク、2022 年。URL: https://proceedings.neurips.cc/paper_files/paper/2022/hash/a48ad12d588c597f4725a8b84af647b5-Abstract-Datasets_and_Benchmarks.html
[31] ジェイソン・リュー、アンキット・シャー、エリック・ローゼン、ステファニー・テレックス。 「Lang2LTL: 自然言語コマンドを時間ロボット タスク仕様に変換する。」 PMLR/CoRL、229、2023。URL: https://proceedings.mlr.press/v229/liu23d.html
[32] フランチェスコ・フギッティとタタガタ・チャクラボルティ。 「NL2LTL: 自然言語命令を線形時相論理式に変換するための Python パッケージ」 AAAI デモンストレーション、37(13):16428-16430、2023。DOI: 10.1609/aaai.v37i13.27068。 URL: https://ojs.aaai.org/index.php/AAAI/article/view/27068[33] ベフラド・ラビエイとマヘシュ・A・クマール。 「LTLCodeGen: ロボット タスク プランニングのための構文的に正しい時相ロジックのコード生成」 arXiv:2503.07902、2025。URL: https://arxiv.org/abs/2503.07902
[34] ジュン・ワン、デヴィッド・スミス・サンダーシン、ジョティルモイ・V・デシュムク、ヤニス・カンタロス。 「ConformalNL2LTL: 自然言語命令を、等角的な正確性が保証された時間論理式に変換する。」 arXiv:2504.21022、2025。URL: https://arxiv.org/abs/2504.21022
[35] Zhonghang Li、Lianghao Xia、Jiabin Tang、Yong Xu、Lei Shi、Long Xia、Dawei ying、Chao Huang。 「UrbanGPT: 時空間大規模言語モデル」 arXiv:2403.00813、2024。URL: https://arxiv.org/abs/2403.00813
[36] ユアン・ユアン、ジンタオ・ディン、ジエ・フォン、デペン・ジン、ヨン・リー。 「UniST: 都市の時空間予測のための即時強化されたユニバーサル モデル」 KDD、2024。DOI: 10.1145/3637528.3671662。 URL: https://dblp.org/rec/conf/kdd/0032D0J024[37] 欧陽晋輝、朱儀傑、項源、迪武。 「TrafficGPT: 時空間エージェント フレームワークによるマルチスケールのトラフィック分析と生成に向けて」 arXiv:2405.05985、2024。URL: https://arxiv.org/abs/2405.05985
[38] チョンハオ・シマ、カトリン・レンツ、カシャップ・チッタ、リー・チェン、ハンシュエ・チャン、チェンゲン・シー、イェンス・バイスウェンガー、ピン・ルオ、アンドレアス・ガイガー、ホンヤン・リー。 「DriveLM: グラフによる視覚的な質問応答による運転」。 ECCV、2024 年。URL: https://github.com/OpenDriveLab/DriveLM
[39] マクシミリアン・アダン、ジュンエン・ロウ、オラ・ショリンワ、マック・シュワガー。 「シンガー: ドローン向けのオンボード ジェネラリストの視覚言語ナビゲーション ポリシー」 arXiv:2509.18610、2025。URL: https://arxiv.org/abs/2509.18610[40] Hengxing Cai、Jinhan Dong、Jingjun Tan、Jingcheng Deng、Sihang Li、Zhifeng Gao、Haidong Wang、Zicheng Su、Agachai Sumalee、Renxin Zhong。 「FlightGPT: 視覚言語モデルを使用した、一般化可能かつ解釈可能な UAV 視覚言語ナビゲーションに向けて」。 EMNLP、2025。DOI: 10.18653/v1/2025.emnlp-main.338。 URL: https://aclanthology.org/2025.emnlp-main.338/
[41] プラナフ・サクセナ、ニシャント・ラグヴァンシ、ニーナ・ゴヴィアス。 「UAV-VLN: UAV 向けのエンドツーエンドのビジョン言語ガイド付きナビゲーション」 arXiv:2504.21432、2025。URL: https://arxiv.org/abs/2504.21432[42] ムー・ジン・キム、カール・ペルチュ、シッダース・カラムチェティ、テッド・シャオ、アシュウィン・バラクリシュナ、スラジ・ネール、ラファエル・ラファイロフ、イーサン・フォスター、グレース・ラム、パンナグ・サンケティ、クアン・ヴオン、トーマス・コラー、ベンジャミン・バーフフィール、ラス・テドレイク、ドーサ・サディ、セルゲイ・レヴィン、パーシー・リャン、チェルシー・フィン。 「OpenVLA: オープンソースのビジョン・言語・アクション・モデル」 arXiv:2406.09246、2024。URL: https://arxiv.org/abs/2406.09246
[43] Octo Model Team、Dibya Ghosh、Homer Walke、Karl Pertsch、Kevin Black、Oier Mees、Sudeep Dasari、Joey Hejna、Tobias Kreiman、Charles Xu、Jianlan Luo、You Liang Tan、Lawrence Yunliang Chen、Pannag Sanketi、Quan Vuong、Ted Xiao、Dorsa Sadigh、Chelsea Finn、Sergeyレヴィン。 「Octo: オープンソースのジェネラリスト ロボット ポリシー」 arXiv:2405.12213、2024。URL: https://arxiv.org/abs/2405.12213[44] アンソニー・ブロハン、ノア・ブラウン、カルバハル判事、エフゲン・チェボタル、シー・チェン、クシシュトフ・チョロマンスキー、ティンリ・ディン、ダニー・ドリース、アヴィナヴァ・デュベイ、チェルシー・フィン、他。 「RT-2: 視覚-言語-行動モデルはウェブの知識をロボット制御に転送します。」 arXiv:2307.15818、2023。URL: https://arxiv.org/abs/2307.15818
[45] クウェンチーム。 「Qwen3テクニカルレポート」 arXiv:2505.09388、2025; QwenLM/Qwen3 公式リポジトリ。 URL: https://arxiv.org/abs/2505.09388; https://github.com/QwenLM/Qwen3
[46] DeepSeek-AI。 「DeepSeek-R1: 強化学習による LLM の推論能力の促進」 arXiv:2501.12948、2025。URL: https://arxiv.org/abs/2501.12948;モデルカード: https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
[47] オープンAI。 「モデル コンテキスト プロトコル (MCP): OpenAI エージェント SDK」公式ドキュメント、2026 年。URL: https://openai.github.io/openai-agents-js/guides/mcp/[48] Woosuk Kwon、Zhuohan Li、Siyuan Zhuang、Ying Sheng、Lianmin Zheng、Cody Hao Yu、Joseph E. Gonzalez、Hao Zhang、Ion Stoica。 「PagesAttention を使用した大規模言語モデルの効率的なメモリ管理」 arXiv:2309.06180、2023。URL: https://arxiv.org/abs/2309.06180
[49] エヌビディア。 「NVIDIA TensorRT-LLM」公式ドキュメント、2026 年。URL: https://docs.nvidia.com/tensorrt-llm/index.html
[50] 胡錦鵬、王偉、劉暁暁、張静。 「低高度経済における大規模モデル: 応用と課題」 ビッグ データとコグニティブ コンピューティング、10(1):33、2026。DOI: 10.3390/bdcc10010033。 URL:https://www.mdpi.com/2504-2289/10/1/33
[51] ジー・ジャオとシャオ・リン。 「大規模な言語モデルによって強化された汎用航空インテリジェント エージェント」。 arXiv:2503.08302、2025。URL: https://arxiv.org/abs/2503.08302