Routenplanung für städtische Drohnen in geringer Höhe: Theorie und Algorithmus in CBD-Szenarien mit hoher Dichte
Analysiert systematisch die Kernprobleme und Lösungsideen der städtischen UAV-Routenplanung in geringer Höhe und deckt die Methoden A*, RRT*, APF, FM², MILP, ORCA und MARL mit vollständiger mathematischer Ableitung und Gleichungen ab.
Städtische UAV-Routenplanung in geringer Höhe: Theorie und Algorithmus in CBD-Szenarien mit hoher Dichte
Wenn Hunderte von Drohnen gleichzeitig zwischen Wolkenkratzern pendeln, ist die Routenplanung nicht länger ein einfaches Problem des „Fliegens von Punkt A nach Punkt B“ – es ist ein hochdimensionales eingeschränktes Optimierungsproblem, das ein Gleichgewicht zwischen dreidimensionalem Raum, Zeit, Energie und Sicherheit anstrebt.
Einleitung: Warum ist CBD so schwierig?
Der städtische Luftraum in geringer Höhe wird normalerweise als Flugreichweite 0–300 m (AGL) über dem Boden definiert. Dieses Höhenniveau ist zufällig das Hauptschlachtfeld für UAV-Logistik, Inspektion, Notfallmaßnahmen und andere Anwendungen. Das CBD (Central Business District) ist aus drei Gründen das komplexeste Teilszenario:
1. Dichte Bebauung bildet einen „Urban Canyon“
Durch Hochhäuser sind die verfügbaren Flugkorridore extrem eng und die Sichtlinie ist blockiert, was die Genauigkeit des GPS verringert. Auch die Kanten der Gebäude erzeugen starke Turbulenzen. In geringen Höhen unter 50 Metern können diese Turbulenzen dazu führen, dass ein kleiner Multirotor völlig die Kontrolle verliert.
2. UAVs mit hoher Dichte verursachen intensive Konflikte
In einer Vorstadtszene fliegen möglicherweise nur wenige Drohnen gleichzeitig. Während bei einem ausgereiften UTM-System (Urban Air Traffic Management) die Anzahl der Drohnen über dem CBD mehr als 40 Drohnen pro Minute erreichen kann. Das bedeutet, dass die Konflikterkennung und -lösung (Conflict Detection & Resolution, CD&R) zum zentralen Engpass des Systems und nicht mehr zu einer Randfunktion wird.
3. Dynamisches Hindernis und Multi-Constraint-Kopplung
Neben Gebäuden müssen Drohnen auch mit temporären Flugverbotszonen, bemannten Flugrouten, Windfeldänderungen in Echtzeit und Sicherheitsrisiken aufgrund der Menschenansammlung am Boden umgehen – all diese Faktoren machen es für einen einzelnen Flugplanungsalgorithmus schwierig, allein damit umzugehen.
1. Problemmodellierung: Flugprobleme in mathematische Probleme umwandeln
1.1 3D-Belegungsraster
Diskretisieren Sie den städtischen Raum in einem Voxelgitter, und jedes Voxel zeichnet seinen Belegungsstatus auf:
Die Voxelauflösung beträgt typischerweise 1–5 m und die CBD-Kernregion kann auf 0,5 m verfeinert werden. Die Gebäudehöhendaten stammen aus einer GIS-Datenbank (Geographic Information System) und werden in Kombination mit Echtzeitsensoren dynamisch aktualisiert.
1.2 Mathematische Definition der 4D-Flugbahn
Die Flugbahn eines einzelnen UAV ist eine zeitlich parametrisierte Raumkurve:$$
\boldsymbol{\xi}(t) = \bigl(x(t),; y(t),; z(t)\bigr), \quad t \in [t_0,, t_f]
|\boldsymbol{\xi}_i(t) - \boldsymbol{\xi}_j(t)|2 \geq d{sep}, \quad \forall, i \neq j,; \forall, t \in [t_0, t_f]
d(u,v) = \ell_{uv}\cdot\bigl(1 + \beta\cdot\mathcal{R}_{uv}\bigr)
$$Darunter ist die Länge des Korridorsegments, ist der Bodenrisikowert des Korridors (kombiniert Faktoren wie Bevölkerungsdichte, Gebäudetyp, Unfallfolgen usw.) und ist der Risikogewichtskoeffizient. Dies führt dazu, dass A* dazu tendiert, Routen zu wählen, die über Gebiete mit geringem Risiko (z. B. Flüsse, Parks) fliegen, auch wenn diese über leichte Umwege führen.
Einschränkungen von A*: Die Qualität der Luftraumkarte bestimmt die Qualität des Verständnisses. Bei CBD mit hoher Dichte kann die Anzahl der Knoten im Diagramm Hunderttausende erreichen, und die Erstellung des Diagramms selbst ist eine Herausforderung.
RRT* (Rapidly-exploring Random Tree Star) erkundet mögliche Pfade durch zufällige Stichproben im kontinuierlichen Raum, was sich besonders für hochdimensionale und komplexe Hindernisszenen eignet.
Nächste-Nachbarn-Abfrage – Finden Sie den Knoten, der dem zufälligen Stichprobenpunkt im Baum am nächsten liegt:
Schritterweiterung – Erweitern Sie die Schrittgröße von der Richtung zur Richtung :
Die Kernverbesserung von RRT – Rewire:* Finden Sie alle benachbarten Knoten in der Kugel mit als Mittelpunkt und dem Radius :
Dabei ist die Anzahl der Knoten des aktuellen Baums, die Raumdimension (3D-Szene ) und eine Konstante, die sich auf das freie Raumvolumen bezieht. Dieser Radius schrumpft mit zunehmender Anzahl von Abtastpunkten und gewährleistet so eine asymptotische Optimalität.
Kostenaktualisierung:
Wenn die Kosten von durch reduziert werden können, wird eine erneute Verbindung durchgeführt:$$
\text{Wenn } c(x_{near}) > c(x_{new}) + d(x_{new},, x_{near}),\text{ dann ändere den übergeordneten Knoten von } x_{near} \text{ in } x_{new}
VO_{ij}^\tau = \left{\mathbf{v}_i ;\middle|; \exists, t\in[0,\tau],; \mathbf{p}_i+\mathbf{v}_i t ;\in; \mathbf{p}_j+\mathbf{v}j t \oplus \mathcal{D}(d{sep})\right}
wobei die Größe der minimalen Geschwindigkeitsänderung ist und auf die Normalenrichtung der -Grenze zeigt.
Die Menge der zulässigen Geschwindigkeiten für den Agenten (schneidet alle Nachbarbeschränkungen und dann die dynamischen Beschränkungen):
Darunter kodiert dynamische Einschränkungen wie maximale Geschwindigkeit und Beschleunigung. ORCA hat in Dichteszenarien von mehr als 40 Bildern/Minute eine Erfolgsquote von 100 % erreicht, mit einer Rechenkomplexität von , was es für den Einsatz in Echtzeit geeignet macht.
Der städtische Luftraum wird als gewichteter gerichteter Graph modelliert:
Knoten: über Straßenkreuzungen, Gebäudedächern, wichtigen Übergabepunkten
Kante: Legaler Flugkorridor zwischen zwei Knoten (muss die Überprüfung der Kollisionserkennung bestehen)
Kantengewichtung: Skalare Gewichtung mit mehreren Zielen
Einschränkungen der Korridorkapazität (die Anzahl der gleichzeitig passierenden UAVs überschreitet nicht die Obergrenze):
Der Belegungsstatus des gesamten Luftraums kann durch einen vierdimensionalen Tensor beschrieben werden ( ist das Voxelgitter, ist die Anzahl der Zeitschlitze):$$
\mathbf{A} \in {0,1}^{N_x\times N_y\times N_z\times N_t}, \quad A_{x,y,z,t} = 1 \iff \exists\text{ UAV besetztes Voxel}(x,y,z)\text{ im Zeitfenster }t
You can't use 'macro parameter character #' in math mode ### 4.2 Rotor-UAV-Energieverbrauchsmodell Der Energieverbrauch ist ein wichtiges Optimierungsziel für die Routenplanung und erfordert eine genaue Modellierung. **Schwebekraft** (abgeleitet aus der Blattelement-Impulstheorie):
You can't use 'macro parameter character #' in math mode Für einen typischen kleinen Multikopter ($m\ungefähr 1\,\text{kg}$) liegt $v^*$ typischerweise zwischen 8–12 m/s. ---## 5. Windfeld und städtischer Canyon-Effekt ### 5.1 Städtische Windfeldmodellierung Die Windgeschwindigkeitsverteilung in städtischen Schluchten ist viel komplexer als auf dem Land, und die Weibull-Verteilung wird häufig in der statistischen Modellierung verwendet:
TI = \frac{\sigma_u}{\bar{u}}, \qquad \sigma_u = \sqrt{\overline{u’^2}}
You can't use 'macro parameter character #' in math mode Korridore mit $TI > 0,3$ werden normalerweise als Hochrisikokorridore markiert und der Planer wird die Kantengewichtung dieses Segments aktiv vermeiden oder erhöhen. ### 5.2 Dynamischer SicherheitsradiusDie Turbulenzen um Gebäude herum nehmen mit abnehmendem Höhenspielraum stark zu. Daher sollte der Sicherheitsabstand keine feste Konstante sein, sondern sich dynamisch an die Flughöhe anpassen:
\rho\bigl(\mathbf{p}(t)\bigr) \geq d_{safe}\bigl(z(t)\bigr), \quad \forall, t \in [t_0, t_f]
You can't use 'macro parameter character #' in math mode --- ## 6. Kollaborative Optimierung mehrerer Maschinen: Globale MILP-Modellierung Für das gemeinsame Pfad- und Zeitschlitzzuweisungsproblem von $N$-Drohnen kann ein **Mixed Integer Linear Programming (MILP)**-Modell erstellt werden, um die global optimale Lösung im kleinen bis mittleren Maßstab ($N\leq 50$) zu erhalten. **Zielfunktion** (Minimierung der gesamten Fertigstellungszeit und des Energieverbrauchs aller Drohnen):
You can't use 'macro parameter character #' in math mode MINLP ist ein NP-schweres Problem, das durch in der Praxis häufig verwendete heuristische Algorithmen (zufällige fraktale Suche SFS, Gepardenoptimierung MCO usw.) näherungsweise gelöst wird. --- ## 7. Verstärkungslernlösung: MARL und Aufmerksamkeitsmechanismus Wenn die Größe der UAVs 100 übersteigt, ist die Rechenkomplexität von MILP nicht akzeptabel. **Multi-Agent Reinforcement Learning (MARL)** bietet eine Alternative für Offline-Training und extrem schnelle Inferenz. ### 7.1 Design der Belohnungsfunktion Die Belohnung, die jede Drohne $i$ zum Zeitpunkt $t$ erhält:
r_i^t = r_{Ankunft}\cdot\mathbf{1}[Ziel] - c_{Schritt} - c_{Konflikt}\cdot\mathbf{1}[Konflikt] - c_{Umweg}\cdot|\mathbf{p}i^t - \mathbf{p}{direkt}|
$$Die Bedeutung jedes Elements: ist die positive Belohnung für das Erreichen des Ziels; ist die Zeitstrafe für jeden Flugschritt; ist die Strafe, wenn ein Konflikt auftritt; ist die Umwegstrafe für das Abweichen von der Geraden.
7.2 Double-DQN-Update (diskreter Aktionsraum)
Das Online-Netzwerk wählt Aktionen aus und das Zielnetzwerk wertet Werte aus, wodurch Auswahl und Bewertung entkoppelt werden, um Überschätzungsfehler zu reduzieren.
Die Entscheidungsfindung jeder Drohne im CBD erfordert die Erfassung des Status ihrer umliegenden Nachbarn. Der Aufmerksamkeitsmechanismus ermöglicht es dem Agenten , den Einfluss von Nachbarn dynamisch zu gewichten:
Das Aufmerksamkeitsgewicht spiegelt die Relevanz des Nachbarn für die Entscheidungsfindung des Agenten wider. Nachbarn mit geringen Abständen und großen Geschwindigkeitskonflikten erhalten naturgemäß höhere Gewichte.
You can't use 'macro parameter character #' in math mode Der Clip-Vorgang begrenzt die Aktualisierungsschrittgröße auf den Bereich von $[1-\varepsilon,\, 1+\varepsilon]$ (normalerweise $\varepsilon=0,2$), um zu verhindern, dass das Training aufgrund übermäßiger Richtlinienaktualisierungen abstürzt. **Zentralisiertes Training, dezentrale Ausführung (CTDE)-Paradigma:** - **Trainingsphase**: Das Bewertungsnetzwerk $V(s^{global};\phi)$ nutzt den globalen Status und kann alle Agenteninformationen wahrnehmen - **Ausführungsphase**: Das Richtliniennetzwerk $\pi_\theta(a_i\mid o_i)$ verwendet nur lokale Beobachtungen des Agenten $i$, ohne Kommunikation --- ## 8. Flugbahnglättung: Bézier-Kurve und minimaler Fang Das Ergebnis der Pfadplanung ist häufig eine Reihe diskreter Wegpunkte, und die direkte Verfolgung dieser Wegpunkte führt zu undurchführbaren scharfen Kurven. Es ist notwendig, durch **Trajektorienglättung** dynamisch realisierbare kontinuierliche Trajektorien zu erzeugen. ### 8.1 Bézier-Kurve Eine Bézier-Kurve der Ordnung $n$ wird durch $n+1$ Kontrollpunkte $\{\mathbf{P}_i\}$ definiert:
\boldsymbol{\xi}(u) = \sum_{i=0}^{n}\binom{n}{i}(1-u)^{n-i}u^i,\mathbf{P}_i, \quad u \in [0,1]
You can't use 'macro parameter character #' in math mode ### 8.2 Minimum Snap: Die Standardlösung für Quadcopter Bei einem Quadrocopter-UAV ist die Minimierung von Snap (der zweiten Ableitung der Beschleunigung) gleichbedeutend mit der Minimierung der Änderungsrate des erforderlichen Schubs, was zu einer optimalen Flugdynamik führt:
You can't use 'macro parameter character #' in math mode Die Matrix $\mathbf{Q}$ kodiert das Snap-Integral (kann analytisch berechnet werden), und die Gleichheitsbeschränkung $\mathbf{A}_{eq}\mathbf{c}=\mathbf{b}_{eq}$ zwingt die Trajektorie, durch alle Pfadpunkte zu verlaufen und stellt die Kontinuität von Position, Geschwindigkeit und Beschleunigung zwischen Segmenten sicher. --- ## 9. Horizontaler Methodenvergleich| Methode | Vollständigkeit | Optimalität | Zeitkomplexität | Echtzeit | Skalierbarkeit auf mehreren Maschinen | |------|--------|--------|------------|--------|------------| | **A\*** | Komplett | Optimal (diskreter Graph) | $O(b^d)$ | Mittel | Schlecht | | **RRT\*** | Wahrscheinlichkeitsvollständig | Asymptotisch optimal | $O(n\log n)$ | Besser | Mittel | | **APF** | Unvollständig | Keine Garantie | $O(1)$/Schritt | Ausgezeichnet | Gut | | **FM²** | Komplett | Optimal (kontinuierlich) | $O(N\log N)$ | Mittel | Mittel | | **MILP** | Komplett | Globales Optimales | NP-hart | Schlecht | Mittel ($N\leq50$) | | **ORCA** | Wahrscheinlichkeitsvollständig | Lokales Optimum | $O(N^2)$ | Ausgezeichnet | Ausgezeichnet | | **MARL+Attn** | Vollständige Wahrscheinlichkeit | Ungefähr | Schweres Training, schnelle Schlussfolgerung | Gut | Ausgezeichnet | **Auswahlvorschläge:** - **Kleiner Maßstab, hohe Sicherheitsanforderungen** ($N\leq 20$) → MILP global optimal - **Mittlere Skala, echtzeitsensitiv** (20 $ < N \leq 100$) → A\* / RRT\* + ORCA-Konfliktlösung - **Großer Maßstab, hohe Dichte** ($N > 100$) → MARL + Aufmerksamkeitsmechanismus (Inferenzverzögerung $< 10\,\text{ms}$) --- ## 10. Zusammenfassung und Ausblick Die Planung von UAV-Routen in städtischen Gebieten in geringer Höhe, insbesondere bei hoher Dichte, in CBD-Szenarien ist ein multidisziplinäres systemtechnisches Problem. Dieser Artikel sortiert die komplette Methodenkette von der **Einzelmaschinen-Pfadplanung** (A\*, RRT\*, APF, FM²) über die **Mehrmaschinen-Konfliktlösung** (CD&R, ORCA, MILP) bis hin zu **Lernmethoden** (MARL, PPO, Achtung) und gibt den genauen mathematischen Ausdruck jedes Kernglieds an. **Drei große ungelöste Herausforderungen:** 1. **Online-Neuplanung in Echtzeit**: Wenn eine plötzliche Flugverbotszone oder ein Drohnenausfall auftritt, muss das System die Neuplanung aller betroffenen Flugbahnen innerhalb von 200 ms abschließen. Derzeit bleibt MILP weit hinter dieser Anforderung zurück und MARL ist der vielversprechendste Kandidat.2. **Digitale Zwillinge und Wahrnehmungsfusion**: Präzise dreidimensionale Stadtkarten in Echtzeit (einschließlich dynamischer Gebäudekonstruktion, temporärer Einfriedungen und meteorologischer Informationen) sind die Grundlage für die Qualität der Routenplanung. Es wird erwartet, dass die digitale Zwillingstechnologie eine Synchronisierung des Luftraumstatus auf Zentimeter- und Subsekundenebene erreichen wird. 3. **Technische Umsetzung des Regulierungsrahmens**: Die Vorschriften der Civil Aviation Administration of China (CAAC) für das Tiefflugmanagement, der europäische EASA U-Space und die amerikanischen FAA UTM CONOPS haben alle klare Anforderungen an die Konfliktlösungszeit, das Format der Flugplaneinreichung, Notlandeverfahren usw., und das Algorithmusdesign muss eng mit den regulatorischen Grenzen verknüpft werden. > Aus mathematischer Sicht ist die Routenplanung für städtische Tiefflugrouten ein nicht-konvexes, nicht-lineares, gemischt-ganzzahliges, in Echtzeit eingeschränktes Optimierungsproblem mit mehreren Agenten. Kein einzelnes Framework kann es „mit einem Klick lösen“ – in der Ingenieurspraxis handelt es sich oft um eine mehrstufige Hybridarchitektur: Kartenplanung wird auf der strategischen Ebene verwendet, ORCA wird auf der taktischen Ebene verwendet und APF wird auf der Notfallebene verwendet, die zusammen ein robustes Flugverkehrsmanagementsystem bilden. --- **Hauptreferenzen:**1. Karaman, S. & Frazzoli, E. (2011). *Abtastbasierte Algorithmen für optimale Bewegungsplanung.* International Journal of Robotics Research, 30(7), 846–894. 2. Van den Berg, J., Guy, S. J., Lin, M. & Manocha, D. (2011). *Reziproke N-Körper-Kollisionsvermeidung.* Robotics Research, 3–19. 3. Zeng, Y., Xu, J. und Zhang, R. (2019). *Energieminimierung für die drahtlose Kommunikation mit Drehflügel-UAV.* IEEE Transactions on Wireless Communications, 18(4), 2329–2345. 4. Mueller, M. W., Hehn, M. & D'Andrea, R. (2015). *Ein rechnerisch effizientes Bewegungsprimitiv für die Trajektorienerzeugung von Quadrocoptern.* IEEE Transactions on Robotics, 31(6), 1294–1310. 5. Brittain, M. & Wei, P. (2019). *Autonomer Fluglotse: Ein tiefgreifender Multiagenten-Lernansatz.* arXiv:1905.01303. 6. Bertram, J. & Wei, P. (2020). *Verteilte rechnerische Anleitung für urbane Luftmobilität mit hoher Dichte.* AIAA Aviation Forum. 7. Valavanis, K. P. & VachtsEvanos, G. J. (Hrsg.). (2015). *Handbuch unbemannter Luftfahrzeuge.* Springer. 8. Augugliaro, F., Schoellig, A. P. & D'Andrea, R. (2012). *Erzeugung kollisionsfreier Flugbahnen für eine Quadrocopter-Flotte.* IEEE/RSJ IROS, 3977–3982.