Известия Саратовского университета. Новая серия.

Серия Математика. Механика. Информатика

ISSN 1816-9791 (Print)
ISSN 2541-9005 (Online)


Для цитирования:

Силинская А. А., Богомолов А. С., Кушников В. А. Математическая модель процесса эвакуации социальных групп из помещений с несколькими выходами // Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика. 2026. Т. 26, вып. 2. С. 302-311. DOI: 10.18500/1816-9791-2026-26-2-302-311, EDN: UEEHGG

Статья опубликована на условиях лицензии Creative Commons Attribution 4.0 International (CC-BY 4.0).
Полный текст:
(downloads: 5)
Язык публикации: 
русский
Рубрика: 
Тип статьи: 
Научная статья
УДК: 
001.891.573
EDN: 
UEEHGG

Математическая модель процесса эвакуации социальных групп из помещений с несколькими выходами

Авторы: 
Силинская Анна Александровна, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Богомолов Алексей Сергеевич, Федеральный исследовательский центр «Саратовский научный центр Российской академии наук»
Кушников Вадим Алексеевич, Федеральный исследовательский центр «Саратовский научный центр Российской академии наук»
Аннотация: 

В работе предложена модель для симуляции многоагентной эвакуации с использованием алгоритма Multi-Agent Proximal Policy Optimization (MAPPO). Модель учитывает наличие нескольких эвакуационных выходов с разным временем открытия, нескольких типов агентов, влияние паники на движение и социальные взаимодействия типа «лидер – последователь». Уделено внимание использованию гибридного пространства действий (дискретный выбор выхода, непрерывное движение). Обучение проводилось по принципу «curriculum learning» с постепенным повышением числа агентов для улучшения обобщающей способности модели и адаптации к разному числу агентов. Модель дополнена рядом усовершенствований: использованием dropout-слоев для предотвращения переобучения, экспоненциальным затуханием исследования для плавного перехода к точным действиям, нормализацией наград для стабилизации обучения. Обучение модели проводилось в среде $15\times20$ м с заданным количеством выходов определенной ширины (три выхода шириной 1.5 м, интервал открытия 6 с). Предусмотрена логика распространения информации о выходах. Лидеры знают обо всех выходах с самого начала симуляции. Индивидуальные агенты узнают о выходах в радиусе 5 м и передают информацию соседям в радиусе 2 м. Социальные группы имеют правила поведения: пожилые агенты получают бонус к скорости, а лидеры принимают стратегические решения. Результаты вычислительных экспериментов для сценариев с 50 агентами показали, что наличие социальных групп и лидеров ускоряет процесс эвакуации, особенно для пожилых агентов. Наибольшая эффективность достигалась при наличии двух лидеров, тогда как сценарий с одним лидером приводил к заторам, увеличению времени эвакуации и уровню паники. Таким образом, предложенная модель демонстрирует перспективность применения методов обучения с подкреплением для анализа и оптимизации эвакуации в помещениях сложной конфигурации. Разработанная математическая модель предназначена для использования при создании цифровых двойников процессов имитации и оптимизации потоков людей, а также вычислительных экспериментов по расчету эффективного времени и путей выхода.

Благодарности: 
Исследование выполнено при финансовой поддержке Министерства науки и высшего образования Российской Федерации в рамках государственного задания (проект № FREM-2026-0006).
Список источников: 
  1. Коткова Е. А., Матвеев А. В., Нефедьев С. А., Таранцев А. А. Агентное моделирование процесса эвакуации людей при пожарах в зданиях: обзор подходов и исследований // Современные наукоемкие технологии. 2023. № 10. С. 55–62. DOI: https://doi.org/10.17513/snt.39791, EDN: CZHEJY
  2. Zia K., Ferscha A. An agent-based model of crowd evacuation: combining individual, social and technological aspects // Proceedings of the 2020 ACM SIGSIM Conference on Principles of Advanced Discrete Simulation. New York : Association for Computing Machinery, 2020. P. 129–140. DOI: https://doi.org/10.1145/3384441.3395973
  3. Суханов В. О., Кузьмин А. И., Скороходов Д. В. Геоинформационная система поддержки принятия решений на эвакуацию населения // Современные технологии обеспечения гражданской обороны и ликвидации последствий чрезвычайных ситуаций. 2019. № 1 (10). С. 411–413. EDN: WNCRRV
  4. Цвиркун А. Д., Резчиков А. Ф., Самарцев А. А., Богомолов А. С., Иващенко В. А., Кушников В. А., Филимонюк Л. Ю. Интегрированная модель динамики распространения опасных факторов пожара в помещениях и эвакуации из них // Вестник компьютерных и информационных технологий. 2019. № 2 (176). С. 47–54. DOI: https://doi.org/10.14489/vkit.2019.02.pp.047-054, EDN: ZACMDZ
  5. Цвиркун А. Д., Резчиков А. Ф., Самарцев А. А., Иващенко В. А., Богомолов А. С., Кушников В. А., Филимонюк Л. Ю. Система интегрированного моделирования распространения опасных факторов пожара и эвакуации людей из помещений // Автоматика и телемеханика. 2022. № 5. С. 26–42. DOI: https://doi.org/10.31857/S0005231022050038, EDN: ABHDTO
  6. Samartsev A., Ivaschenko V., Rezchikov A., Kushnikov V., Filimonyuk L., Bogomolov A. Multiagent model of people evacuation from premises while emergency // Advances in Systems Science and Applications. 2019. Vol. 19, iss. 1. P. 98–115. DOI: https://doi.org/10.25728/assa.2019.19.1.558, EDN: JJSDFW
  7. Гамаюнова В. О., Богомолов А. С., Кушников В. А., Иващенко В. А. Мультиагентное моделирование эвакуации из помещений с учетом столкновений агентов // Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика. 2025. Т. 25, вып. 1. С. 106–115. DOI: https://doi.org/10.18500/1816-9791-2025-25-1-106-115, EDN: TLQGGD
  8. Rosa A. C., Falqueiro M. C., Bonacin R., De Mendonça F. L. L., Filho G. P. R., Gonçalves V. P. EvacuAI: An analysis of escape routes in indoor environments with the aid of reinforcement learning // Sensors. 2023. Vol. 23, iss. 21. Art. 8892. DOI: https://doi.org/10.3390/s23218892
  9. Ünal A. E., Gezer C., Pak B. K., Güngör V. Ç. Generating emergency evacuation route directions based on crowd simulations with reinforcement learning // 2022 Innovations in Intelligent Systems and Applications Conference (ASYU). Antalya : IEEE, 2022. P. 1–6. DOI: https://doi.org/10.1109/ASYU56188.2022.9925560
  10. Xu D., Huang X., Mango J., Li X., Li Z. Simulating multi-exit evacuation using deep reinforcement learning // Transactions in GIS. 2021. Vol. 25, iss. 3. P. 1542–1564. DOI: https://doi.org/10.1111/tgis.12738
  11. Sinpan N., Sasithong P., Chaudhary S., Poomrittigul S., Leelawat N., Wuttisittikulkij L. Simulative investigations of crowd evacuation by incorporating reinforcement learning scheme // ICACS ’22: Proceedings of the 6th International Conference on Algorithms, Computing and Systems. New York : Association for Computing Machinery, 2022. P. 1–5. DOI: https://doi.org/10.1145/3564982.3564983
  12. Yu C., Velu A., Vinitsky E., Gao J., Wang Y., Bayen A., Wu Y. The surprising effectiveness of PPO in cooperative multi-agent games // Advances in Neural Information Processing Systems. 2022. Vol. 35. P. 24611–24624.
  13. Xiong J., Wang Q., Yang Z., Sun P., Han L., Zheng Y., Fu H., Zhang T., Liu J., Liu H. Parametrized deep Q-networks learning: Reinforcement learning with discrete-continuous hybrid action space // arXiv preprint arXiv:1810.06394. 2018. DOI: https://doi.org/10.48550/arxiv.1810.06394
  14. Srivastava N., Hinton G., Krizhevsky A., Sutskever I., Salakhutdinov R. Dropout: A simple way to prevent neural networks from overfitting // Journal of Machine Learning Research. 2014. Vol. 15. P. 1929–1958.
  15. Gal Y., Ghahramani Z. Dropout as a Bayesian approximation: Representing model uncertainty in deep learning // Proceedings of the 33rd International Conference on Machine Learning. New York, USA : PMLR, 2016. P. 1050–1059.
  16. Sutton R. S., Barto A. Reinforcement learning: An introduction. Cambridge : The MIT Press, 2020. 552 p.
  17. Lillicrap T. P., Hunt J. J., Pritzel A., Heess N., Erez T., Tassa Y., Silver D., Wierstra D. Continuous control with deep reinforcement learning // arXiv preprint arXiv:1509.02971. 2015. DOI: https://doi.org/10.48550/arXiv.1509.02971
  18. Schulman J., Wolski F., Dhariwal P., Radford A., Klimov O. Proximal policy optimization algorithms // arXiv preprint arXiv:1707.06347. 2017. DOI: https://doi.org/10.48550/arXiv.1707.06347
  19. Narvekar S., Peng B., Leonetti M., Sinapov J., Taylor M. E., Stone P. Curriculum learning for reinforcement learning domains: A framework and survey // Journal of Machine Learning Research. 2020. Vol. 21, iss. 1. P. 181:1–181:50.
  20. Wang L., Zheng J.-H., Zhang X.-S., Zhang J.-L., Wang Q.-Z., Zhang Q.-Zh. Pedestrians’ behavior in emergency evacuation: Modeling and simulation // Chinese Physics B. 2016. Vol. 25, iss. 11. Art. 118901. DOI: https://doi.org/10.1088/1674-1056/25/11/118901
  21. Trivedi A., Rao S. Agent-based modeling of emergency evacuations considering human panic behavior // IEEE Transactions on Computational Social Systems. 2018. Vol. 5, iss. 1. P. 277– 288. DOI: https://doi.org/10.1109/TCSS.2017.2783332
  22. Ding N., Sun C. Experimental study of leader-and-follower behaviours during emergency evacuation // Fire Safety Journal. 2020. Vol. 117. Art. 103189. DOI: https://doi.org/10.1016/j.firesaf.2020.103189
Поступила в редакцию: 
12.11.2025
Принята к публикации: 
29.11.2025
Опубликована: 
01.06.2026