обзор существующих подходов, архитектур и направлений исследований
Аннотация
Данная обзорная статья посвящена анализу существующих научных подходов к решению задач автоматизированного парящего полёта в термических восходящих потоках с применением методов машинного обучения и глубокого обучения с подкреплением. Рассматриваются три ключевые подзадачи: предсказание движения ядра термического потока (центровка термика), классификация состояния деградации потока и оптимизация курса при выходе из термика. Проводится сравнительный анализ архитектур нейронных сетей (LSTM, GRU, 1D CNN, Трансформеры) применительно к многомерным полётным временным рядам. Обсуждаются проблемы шумов GPS-данных и методы их фильтрации. Оценивается достаточность исторических лог-данных для обучения модели и формулируется план разработки прототипа бортовой интеллектуальной системы подсказок для пилота-парителя.
1. Введение: актуальность задачи
Парящий полёт на безмоторных летательных аппаратах — планерах, дельтапланах и парапланах — является одной из наиболее интеллектуально насыщенных форм авиации. Пилот должен в реальном времени принимать решения о входе в термический поток, центровке круга в зоне максимального подъёма, определении момента ослабления потока и выборе оптимального курса выхода. Качество этих решений напрямую определяет среднюю скорость маршрута и безопасность полёта.
Традиционно пилоты опирались на показания вариометра — прибора, измеряющего вертикальную скорость, — и на собственный опыт. Однако ряд факторов делает задачу принятия решений исключительно сложной: турбулентность внутри потоков, их нестационарность (дрейф, деформация, затухание), влияние горизонтального ветра и ограниченная информативность одномерного сигнала вариометра. В то же время современные бортовые GPS-приёмники и барометрические датчики позволяют записывать детальные треки полёта с высоким временным разрешением, формируя обширные массивы данных для анализа.
Прогресс в области глубокого обучения, обучения с подкреплением (RL) и обработки временных рядов создаёт предпосылки для разработки нового класса бортовых приборов — интеллектуальных помощников пилота (AI-copilot), способных в реальном времени прогнозировать оптимальную траекторию в термическом потоке. Данная обзорная статья направлена на систематизацию имеющихся научных результатов, релевантных этой задаче, и формирование методологической основы для дальнейшей разработки.
Актуальность темы подтверждается рядом ключевых проектов: Project Frigatebird (Microsoft Research), пионерской работой Reddy et al. (2018) по обучению с подкреплением в полевых условиях, исследованием Harel et al. (2024) по глубокому RL для парящего полёта с вдохновением от стервятников, а также многочисленными работами в области автономного парения малых БПЛА.
2. Анализ существующих подходов
2.1. Математические и rule-based модели
Исторически первые алгоритмы автономного парения были основаны на эвристических правилах, сформулированных опытными пилотами. Классические правила Рейхманна (Reichmann, 1993) предлагают смещать центр круга в направлении наибольшего вариометрического сигнала. На алгоритмическом уровне это реализуется через оценку положения ядра термика методом центра масс (Allen, 2006) с последующим итеративным уточнением при помощи метода наименьших квадратов (Edwards et al., 2016).
Значительный вклад внёс алгоритм ArduSoar (Tabor et al., 2018), интегрированный в открытый автопилот ArduPilot, который использует расширенный фильтр Калмана для оценки центра и параметров гауссовой модели термика. Алгоритм Кана (Kahn, 2019) предложил использовать два расширенных фильтра Калмана для раздельной оценки положения и параметров потока, что снизило требования к оперативной памяти бортового компьютера.
Ключевое ограничение rule-based подходов — жёсткость заложенного пространства решений. Как отмечают Harel et al. (2024), такие алгоритмы не способны исследовать новые стратегии и, следовательно, имеют ограничения в задачах со сложной динамикой и высокой неопределённостью.
2.2. Подходы на основе машинного обучения
Переход к методам машинного обучения для задач парящего полёта был инициирован работой Wharington (1998), предложившего использовать нейросетевой локализатор центра термика и обучение с подкреплением. Хотя вычислительная сложность его метода не позволяла применять его в реальном времени, идея стимулировала последующие исследования.
Прорывной стала работа Reddy et al. (2018), опубликованная в Nature, в которой впервые был продемонстрирован автономный парящий полёт планера с двухметровым размахом крыла, обученного методом обучения с подкреплением непосредственно в полевых условиях. Стратегия навигации определялась исключительно из опыта, накопленного за несколько дней полётов. Ключевым результатом стала идентификация эффективных навигационных сигналов: вертикальные ускорения воздуха и крутящий момент по крену.
Guilliard et al. (2018, Microsoft Research) формализовали задачу автономного парения как частично наблюдаемый марковский процесс принятия решений (POMDP) и разработали контроллер POMDSoar. Лётные испытания показали статистически значимое преимущество POMDSoar перед ArduSoar, особенно в турбулентных потоках на малых высотах, что объясняется более активной стратегией исследования.
Наиболее комплексное исследование на базе глубокого RL было проведено Harel et al. (2024), опубликованное в Nature Communications. Авторы разработали симуляционную систему для изучения процесса обучения парящему полёту, вдохновлённую полётом стервятников. Были обнаружены узкие места обучения (learning bottlenecks), предложена новая метрика эффективности, а анализ нейронов обученной сети выявил функциональные кластеры, эволюционирующие в процессе обучения.
Особого внимания заслуживает работа по обнаружению термиков с помощью темпоральных свёрточных сетей (Temporal Convolutional Networks, TCN), представленная на IEEE ICRA 2024, в которой реализован подход end-to-end: последовательность сенсорных данных подаётся непосредственно в сеть, которая оценивает положение, силу и радиус встреченных термиков без необходимости отдельных алгоритмов для каждого потока.
3. Архитектуры нейросетей для анализа полётных траекторий
3.1. Рекуррентные сети: LSTM и GRU
Сети с долгой краткосрочной памятью (LSTM, Hochreiter & Schmidhuber, 1997) и управляемыми рекуррентными блоками (GRU, Cho et al., 2014) являются классическим инструментом для анализа последовательностей. В контексте полётных данных они способны моделировать темпоральные зависимости в сигнале вариометра, GPS-координатах и курсе, что делает их естественным выбором для задач предсказания траекторий.
В задаче предсказания траекторий полёта Ma & Tian (2020) показали, что гибридная архитектура CNN-LSTM эффективна для 4D-прогнозирования позиции воздушного судна. Для предсказания траекторий в транспортных системах LSTM традиционно показывает хорошие результаты на коротких горизонтах, но качество деградирует на длинных последовательностях из-за проблемы затухающего градиента.
GRU имеет меньшее число параметров, чем LSTM, что может быть преимуществом для бортовых систем с ограниченными вычислительными ресурсами. Однако экспериментальные сравнения показывают незначительную разницу в качестве между LSTM и GRU для задач средней длины последовательностей.
3.2. Свёрточные сети: 1D CNN и TCN
Одномерные свёрточные нейронные сети (1D CNN) обрабатывают временные ряды параллельно, в отличие от рекуррентных сетей, что даёт преимущество в скорости обучения и инференса. Темпоральные свёрточные сети (TCN, Bai et al., 2018) расширяют стандартные 1D CNN за счёт каузальных и разрежённых (dilated) свёрток, позволяя охватывать большие временные контексты без увеличения числа слоёв.
В работе по обнаружению термиков (IEEE ICRA 2024) именно архитектура TCN была выбрана для сквозного решения задачи одновременного обнаружения и оценки параметров множества восходящих потоков. Авторы продемонстрировали, что TCN надёжно обнаруживает потоки, опираясь исключительно на позицию ЛА и локальную вертикальную скорость ветра. Для нашей задачи TCN представляет значительный интерес, поскольку каузальная архитектура обеспечивает совместимость с real-time обработкой.
3.3. Трансформеры
Архитектура Transformer (Vaswani et al., 2017) с механизмом self-attention позволяет моделировать дальнодействующие зависимости во временных рядах без ограничений, свойственных рекуррентным сетям. Работа по noise-robust прогнозированию траекторий воздушных судов (Nature Scientific Reports, 2025) показала, что модель T+N+HP+AR, основанная на трансформере с шумовым модулем, гибридным позиционным кодированием и авторегрессией, значительно превосходит LSTM и Transformer-XL на длинных последовательностях.
Giuliari et al. (2020) продемонстрировали, что чистый Transformer без сложных модулей взаимодействия может быть конкурентоспособен в задаче прогнозирования траекторий. Для предсказания траекторий автономных транспортных средств TrajectoFormer (2024) показал значительное сокращение времени обучения и повышение точности по сравнению с LSTM.
В контексте предлагаемой задачи парящего полёта трансформеры имеют ключевое преимущество: self-attention позволяет модели «заглядывать» в произвольную точку истории полёта внутри окна, что критически важно для определения моментов максимального подъёма на предыдущих кругах.
3.4. Сравнительная таблица архитектур
| Критерий | LSTM / GRU | 1D CNN / TCN | Transformer | Рекомендация |
| Длинные зависимости | Умеренно | TCN: хорошо (dilated) | Отлично (self-attention) | Transformer для окон >60 с |
| Скорость инференса | Средняя | Высокая | Средняя (зависит от длины) | TCN для real-time на MCU |
| Объём параметров | GRU: компактен | Компактен | Больше | GRU/TCN для Edge-устройств |
| Устойчивость к шуму | Средняя | Средняя | Повышенная (noise module) | Transformer + noise layer |
| Интерпретируемость | Низкая | Средняя | Высокая (attention map) | Transformer для анализа |
4. Проблема шумов и методы фильтрации
4.1. Источники шумов в полётных данных
GPS-координаты в полёте подвержены многочисленным источникам ошибок: многолучёвость (multipath), ионосферные задержки, потери сигнала при крене, квантование координат. Типичная точность потребительского GPS составляет 3–5 метров в горизонтальной плоскости, однако в динамичном полёте с кренами до 45° ошибка может возрастать. Барометрическая высота значительно точнее GPS-высоты (порядка 0.1–0.5 м), но подвержена влиянию атмосферного давления и динамического напора.
Дополнительный шум вносит дискретизация: при записи трека с частотой 1 Гц планер за секунду пролетает 25–40 метров, что создаёт значительную неопределённость в локализации кратковременных явлений. Вычисление вертикальной скорости (vario) как производной высоты по времени усиливает высокочастотный шум.
4.2. Классические методы фильтрации
Фильтр Калмана (Kalman, 1960) остаётся стандартным инструментом для сглаживания GPS-траекторий. Он рекурсивно оценивает состояние динамической системы (позиция + скорость), комбинируя модель движения с зашумлёнными измерениями. Для линейных систем фильтр является оптимальным в смысле минимума среднеквадратичной ошибки. В контексте автопилотов (ArduPilot EKF) используется расширенный фильтр Калмана (EKF), объединяющий GPS, барометр, акселерометр и гироскоп для оценки позиции, скорости и ориентации.
Для нелинейных систем применяются: EKF (линеаризация вокруг текущей оценки), UKF (сигма-точки для аппроксимации нелинейности), CKF (кубатурный фильтр). Исследования показывают, что стандартный фильтр Калмана эффективно сглаживает гауссовский шум, но работает хуже с негауссовым шумом многолучёвости (Liu et al., 2023).
4.3. ML-подходы к фильтрации и восстановлению траекторий
Современные подходы используют нейросети для восстановления «истинной» траектории из зашумлённых данных. Spatiotemporal GAN с механизмом multi-head attention (2023) был предложен для денойзинга траекторий транспортных средств. Подход SINDy (Sparse Identification of Nonlinear Dynamics) применялся для идентификации параметров термиков из зашумлённых данных в реальном времени.
Для нашей задачи рекомендуется двухуровневая схема: первый уровень — классический EKF для фьюжена GPS и барометра (проверенная технология, минимальная задержка); второй уровень — нейросетевой модуль, обученный на парах «зашумлённые данные → восстановленная траектория», полученных из высокоточных записей (post-processing с двухчастотным GPS). Такой подход сочетает надёжность Калмана с адаптивностью нейросети.
5. Обучение с подкреплением для парящего полёта
5.1. Формализация задачи
Задача парящего полёта естественно формализуется как задача последовательного принятия решений. Агент (планер/пилот) наблюдает состояние (вариометр, GPS, курс, крен), выполняет действие (изменение крена, курса) и получает награду (набор высоты, или сохранение энергии). Цель — максимизировать кумулятивную награду, что эквивалентно максимизации средней скороподъёмности или маршрутной скорости.
Reddy et al. (2018) впервые применили классический RL (Q-learning) для обучения стратегии парения в полевых условиях. Пространство состояний включало вертикальные ускорения и крутящий момент по крену. Пространство действий — дискретные значения крена. Награда — набор высоты. Стратегия была обучена за несколько дней полётов и продемонстрировала эффективное использование термиков.
Guilliard et al. (2018) предложили POMDP-формулировку, в которой неопределённость модели термика (положение, сила, радиус) явно учитывается в принятии решений. Агент POMDSoar выполняет Байесовское обновление распределения параметров термика на основе наблюдений и планирует действия с горизонтом упреждения, что обеспечивает баланс между исследованием и эксплуатацией.
5.2. Глубокое обучение с подкреплением
Harel et al. (2024) применили алгоритм PPO (Proximal Policy Optimization) с нейросетевой политикой для обучения парящему полёту в симуляции с горизонтальным ветром. Политика представлялась как нейронная сеть, принимающая на вход состояние (позиция относительно термика, скорость, вертикальная скорость воздуха) и выдающая непрерывное действие (крен). Авторы обнаружили, что процесс обучения имеет характерные узкие места и что нейроны обученной сети организуются в функциональные кластеры.
Для задачи энергосбора из термиков был применён алгоритм TD3 (Twin Delayed Deep Deterministic Policy Gradient) с шестистепенной моделью планера (Aerospace, 2023). Авторы предложили метод симметрии стратегии и модуль коррекции дифференциала скорости ветра для улучшения обобщающей способности.
5.3. Применимость RL к задаче «выхода из потока»
Задачу оптимального выхода из термика можно смоделировать как RL-среду со следующей конфигурацией. Состояние: текущая высота, средняя скороподъёмность за последние N кругов, тренд скороподъёмности, расстояние до следующей точки маршрута, высота над рельефом, прогнозируемые условия на маршруте. Действие: продолжить крутить (с выбором крена) или выйти (с выбором курса). Награда: маршрутная скорость (distance/time) — стандартная метрика эффективности в соревновательном парении. Среда: модель глиссады от текущей высоты с учётом ветра и поляры планера.
Такая формулировка имеет прямые аналоги в задачах принятия решений «stay vs. go» (optimal stopping problems) в RL и хорошо согласуется с существующей литературой. Кроме того, полная стратегия «поиск — использование — выход» была изучена в работе по парящему полёту в условиях случайного расположения термиков (Aerospace, 2023).
6. Оценка реализуемости
6.1. Достаточность исторических данных
Исторические полётные треки представляют собой rich dataset для задач supervised learning: из них можно извлечь тысячи эпизодов термиков с размеченными переменными (позиция ядра, скороподъёмность, момент выхода). Для задач классификации (деградация потока) и регрессии (предсказание смещения ядра) исторические данные достаточны при объёме порядка 500–1000 полётных часов с разнообразными метеоусловиями.
Однако для задач RL, особенно для политики «выхода», исторические данные имеют ограничение: они отражают субоптимальные стратегии конкретных пилотов. Для преодоления этого ограничения рекомендуется гибридный подход: (1) предобучение на исторических данных методом imitation learning (поведенческое клонирование); (2) дообучение в симуляции с использованием модели атмосферы, откалиброванной по реальным данным; (3) опциональное fine-tuning на реальных полётах с инкрементальным обновлением.
6.2. Требования к бортовому оборудованию
Современные микроконтроллеры (ESP32-S3, STM32H7, Raspberry Pi Zero 2W) и edge-ускорители (Coral Edge TPU, NVIDIA Jetson Nano) способны выполнять инференс компактных моделей (TCN, GRU с ~50K параметров) с задержкой менее 100 мс. Для трансформер-моделей может потребоваться дистилляция или квантизация. Питание обеспечивается от бортовой батареи (типичное потребление 0.5–3 Вт).
Для пилота-человека (в отличие от автопилота БПЛА) система является совещательной: она предоставляет рекомендации, а не управляет. Это снижает требования к надёжности в сравнении с системой автопилота и позволяет более агрессивно оптимизировать модель.
6.3. Ключевые риски
Основные риски включают: (1) domain shift между условиями обучения и реальными условиями (различия в характере термиков по регионам, временам года, типам подстилающей поверхности); (2) ограниченная точность GPS в динамическом полёте с кренами; (3) латентность системы — задержка между изменением условий и реакцией модели; (4) вопросы сертификации и юридической ответственности для бортового оборудования в авиации.
7. Примерный план разработки
Этап 1. Сбор и подготовка данных (2–3 мес.)
Формирование базы данных полётных треков (IGC/KML формат). Разработка пайплайна предобработки: парсинг, EKF-фильтрация, вычисление производных (vario, turn rate), сегментация на эпизоды термиков. Аннотирование: автоматическая разметка ядра потока (по максимуму скороподъёмности за круг), классификация фаз (вход, крутение, деградация, выход). Целевой объём: 1000+ часов полёта, 10 000+ эпизодов термиков.
Этап 2. Базовые модели (2–3 мес.)
Реализация и сравнение supervised-моделей для задач 1 (предсказание смещения ядра) и 2 (классификация деградации): LSTM-baseline, TCN, Transformer с позиционным кодированием. Метрики: MAE смещения, точность/полнота для классификации. Абляционные эксперименты по длине входного окна, набору признаков, частоте дискретизации.
Этап 3. RL-модуль и симулятор (3–4 мес.)
Разработка симулятора термического потока на основе модели Гедеона (Gedeon thermal model) с параметрами, извлечёнными из реальных данных. Формулировка RL-задачи «оптимальный выход»: среда, пространства состояний и действий, функция награды (маршрутная скорость). Обучение агента (PPO/TD3). Опциональная интеграция supervised-моделей (этап 2) в контур наблюдения агента.
Этап 4. Интеграция и edge-оптимизация (2–3 мес.)
Объединение модулей в единую систему: предобработка → предсказание ядра → классификация потока → рекомендация курса. Оптимизация для бортового устройства: квантизация (INT8), pruning, дистилляция. Разработка протокола обмена данными (BLE/Wi-Fi) с пилотским дисплеем. Стендовые тесты на записанных данных (offline simulation).
Этап 5. Лётные испытания и валидация (3–6 мес.)
Лётные тесты в режиме «shadow mode» (система работает, но пилот не следует рекомендациям — сравнение post-hoc). Постепенный переход к active mode с оценкой влияния на среднюю маршрутную скорость. Сбор обратной связи от пилотов-испытателей. Дообучение модели на новых данных (online fine-tuning). Подготовка к серийному производству при положительных результатах.
8. Заключение
Проведённый обзор показывает, что создание бортовой интеллектуальной системы подсказок для парящего полёта является реализуемой задачей, опирающейся на зрелую научную базу. Ключевые результаты обзора:
Во-первых, задача автономного парения успешно решается методами RL как в симуляции, так и в реальных полётах (Reddy et al., 2018; Guilliard et al., 2018; Harel et al., 2024). Это подтверждает фундаментальную реализуемость подхода.
Во-вторых, архитектуры TCN и Transformer наиболее перспективны для анализа полётных временных рядов. TCN — для real-time инференса на edge-устройствах, Transformer — для высокоточных предсказаний с интерпретируемыми attention-картами.
В-третьих, проблема шумов GPS решается комбинацией EKF (первичная фильтрация) и нейросетевых методов (адаптивное сглаживание). Барометрический vario в сочетании с инерциальными датчиками обеспечивает высококачественный входной сигнал.
В-четвёртых, исторических треков достаточно для supervised-компонент системы; для RL-компонент необходим гибридный подход с симулятором и опциональным online-дообучением.
Предложенный пятиэтапный план разработки позволяет итеративно валидировать гипотезы и минимизировать технические риски. При успешной реализации система может существенно повысить эффективность и безопасность парящих полётов, сделав мастерство элитных пилотов доступным для более широкого круга спортсменов.
9. Список литературы
[1] Reddy, G., Celani, A., Sejnowski, T. J., & Vergassola, M. (2018). Glider soaring via reinforcement learning in the field. Nature, 562(7726), 236–239. https://doi.org/10.1038/s41586-018-0533-0
[2] Harel, R., Lavi, B., & Bhatt, S. (2024). Revealing principles of autonomous thermal soaring in windy conditions using vulture-inspired deep reinforcement-learning. Nature Communications, 15, 4992. https://doi.org/10.1038/s41467-024-48670-x
[3] Guilliard, I., Rogahn, R., Piavis, J., & Kolobov, A. (2018). Autonomous Thermalling as a Partially Observable Markov Decision Process. Robotics: Science and Systems XIV. arXiv:1805.09875
[4] Allen, M. J. (2006). Updraft model for development of autonomous soaring uninhabited air vehicles. 44th AIAA Aerospace Sciences Meeting, AIAA-2006-1510.
[5] Andersson, K., Kaminer, I., Dobrokhodov, V., & Cichella, V. (2012). Thermal Centering Control for Autonomous Soaring: Stability Analysis and Flight Test Results. Journal of Guidance, Control, and Dynamics, 35(3), 963–975. https://doi.org/10.2514/1.56292
[6] El Tin, F., Borowczyk, A., Sharf, I., & Nahon, M. (2022). Turn Decisions for Autonomous Thermalling of Unmanned Aerial Gliders. Journal of Intelligent & Robotic Systems, 104, 5. https://doi.org/10.1007/s10846-021-01547-3
[7] Tabor, S., Guilliard, I., & Kolobov, A. (2018). ArduSoar: An open-source thermalling controller for resource-constrained autopilots. IROS 2018.
[8] Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS 2017. arXiv:1706.03762
[9] Hochreiter, S. & Schmidhuber, J. (1997). Long Short-Term Memory. Neural Computation, 9(8), 1735–1780. https://doi.org/10.1162/neco.1997.9.8.1735
[10] Cho, K. et al. (2014). Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. arXiv:1406.1078
[11] Bai, S., Kolter, J. Z., & Koltun, V. (2018). An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling. arXiv:1803.01271
[12] Giuliari, F., Hasan, I., Cristani, M., & Galasso, F. (2020). Transformer Networks for Trajectory Forecasting. arXiv:2003.08111
[13] Ma, L. & Tian, S. (2020). A hybrid CNN-LSTM model for aircraft 4D trajectory prediction. IEEE Access, 8, 134668–134680. https://doi.org/10.1109/ACCESS.2020.3010963
[14] Noise-Robust Autoregressive Transformer for Aircraft Trajectory Prediction (2025). Scientific Reports, 15, 11490. https://doi.org/10.1038/s41598-025-96512-7
[15] End-to-End Thermal Updraft Detection and Estimation for Autonomous Soaring Using Temporal Convolutional Networks (2024). IEEE ICRA 2024. https://doi.org/10.1109/ICUAS60882.2024.10611479
[16] Kahn, A. D. (2019). Extended Kalman Filter Estimators for Thermal Localization. AIAA SciTech.
[17] Liu, Y. et al. (2023). Trajectory Smoothing Algorithm Based on Kalman Filter. IEEE ICPICS 2023. https://doi.org/10.1109/ICPICS58376.2023.10148596
[18] Kalman, R. E. (1960). A New Approach to Linear Filtering and Prediction Problems. Journal of Basic Engineering, 82(1), 35–45.
[19] Gedeon, J. (1973). Dynamic analysis of dolphin-style thermal cross-country flight. Technical Soaring, 3, 17–34.
[20] Wharington, J. & Herszberg, I. (1998). Control of a high endurance unmanned air vehicle. Proc. 21st ICAS Congress.
[21] Reichmann, H. (1993). Cross-Country Soaring. 7th edition.
[22] Edwards, D. J. (2016). Thermal Updraft Estimation Using Neural Networks and Least-Squares Regression. AIAA.
[23] Doncieux, S. et al. (2003). Evolutionary Optimization of Neural Network for Soaring Strategy. Proc. GECCO.
[24] Raffin, A. et al. (2021). Stable-Baselines3: Reliable RL Implementations. JMLR, 22, 12348–12355.
[25] Sutton, R. S. & Barto, A. G. (2018). Reinforcement Learning: An Introduction. 2nd ed., MIT Press.
[26] Schulman, J. et al. (2017). Proximal Policy Optimization Algorithms. arXiv:1707.06347
[27] Fujimoto, S. et al. (2018). Addressing Function Approximation Error in Actor-Critic Methods (TD3). ICML 2018. arXiv:1802.09477
[28] Chen, Y. et al. (2021). S2TNet: Spatio-Temporal Transformer Networks for Trajectory Prediction. ACML 2021.
[29] An Online Data-Driven Method for Accurate Detection of Thermal Updrafts Using SINDy (2024). Aerospace, 11(10), 858. https://doi.org/10.3390/aerospace11100858
[30] Energy-Harvesting Strategy Investigation for Glider Autonomous Soaring Using RL (2023). Aerospace, 10(10), 895. https://doi.org/10.3390/aerospace10100895
[31] Study on the Glider Soaring Strategy in Random Location Thermal Updraft via RL (2023). Aerospace, 10(10), 834. https://doi.org/10.3390/aerospace10100834
[32] Gavrinev, V. O. et al. (2024). Autonomous Thermal Soaring Methods: A Systematic Review. Journal of Intelligent & Robotic Systems.