Известия Саратовского университета. Новая серия.
ISSN 1816-9791 (Print)
ISSN 2541-9005 (Online)


Рецензия

Текст рецензии: 
Рецензия на статью «Математическая модель процесса эвакуации социальных групп из помещений с несколькими выходами». Представленная статья посвящена проблеме моделирования эвакуации людей в чрезвычайных ситуациях с использованием современных методов многоагентных систем и обучения с подкреплением. Авторами предложена математическая модель на основе алгоритма Multi-Agent Proximal Policy Optimization (MAPPO), ориентированная на реалистичное воспроизведение поведения различных категорий людей, объединённых как в индивидуальные, так и в социальные группы, с учётом паники, различий в физических характеристиках и ограничений архитектуры помещений. В модели учитываются три возрастные категории с разной скоростью и маневренностью, социальные связи типа «лидер–последователь», а также динамическое распространение информации о выходах. Важным дополнением является использование гибридного пространства действий, сочетающего стратегический выбор (выбор выхода) и непрерывное тактическое движение. Такой подход действительно приближает модель к реалистичной эвакуации и превосходит традиционные детерминированные симуляторы. Авторы уделяют внимание вопросам стабильности и качества обучения MAPPO: используются dropout-слои, нормализация наград и экспоненциальное уменьшение параметров исследования. Применение «curriculum learning» подтверждает стремление обеспечить способность модели адаптироваться к растущей сложности среды и большому числу агентов. В экспериментальной части проведён анализ различных сценариев с числом лидеров от одного до шести, что позволяет сделать содержательные выводы о влиянии социальной структуры на скорость эвакуации. Результаты выглядят убедительно: наличие двух лидеров приводит к оптимальному распределению потоков и сокращению заторов, а также уменьшению уровня паники. Проведена калибровка модели с учётом нормативных документов МЧС, что делает её применимой в инженерных расчётах и в системах поддержки принятия решений для реальных зданий. Недостатком модели является то, что модель обучалась лишь в помещении фиксированной конфигурации, что снижает её универсальность и вынуждает переобучать систему при изменении геометрии. Также вычислительная сложность имеет квадратичную зависимость от числа агентов, что ограничивает масштабируемость до больших потоков людей. Для практических задач городского или массового масштаба желательно развить указанный аспект, например через разбиение пространства на зоны или применение более эффективных механизмов локального взаимодействия. В целом статья производит положительное впечатление. Она объединяет современные методы машинного обучения с моделированием сложного человеческого поведения и демонстрирует их перспективность для анализа эвакуации в динамических условиях. Рекомендую статью к опубликованию.
Согласен на размещение в eLibrary: 
Согласен на размещение текста рецензии в eLibrary в анонимном виде