Известия Саратовского университета. Новая серия.

Серия Математика. Механика. Информатика

ISSN 1816-9791 (Print)
ISSN 2541-9005 (Online)


Для цитирования:

Chernyshova G. Y., Rasskazkin N. D. Software implementation of ensemble models for the analysis of regional socio-economic development indicators [Чернышова Г. Ю., Рассказкин Н. Д. Разработка приложения для реализации ансамблевых моделей в задаче анализа социально-экономических показателей] // Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика. 2022. Т. 22, вып. 1. С. 130-137. DOI: 10.18500/1816-9791-2022-22-1-130-137, EDN: XEKOIL


Статья опубликована на условиях лицензии Creative Commons Attribution 4.0 International (CC-BY 4.0).
Опубликована онлайн: 
31.03.2022
Полный текст:
(downloads: 1883)
Язык публикации: 
английский
Рубрика: 
Тип статьи: 
Научная статья
УДК: 
519.688
EDN: 
XEKOIL

Software implementation of ensemble models for the analysis of regional socio-economic development indicators
[Разработка приложения для реализации ансамблевых моделей в задаче анализа социально-экономических показателей]

Авторы: 
Чернышова Галина Юрьевна, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Рассказкин Никита Дмитриевич, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского
Аннотация: 

При решении задачи анализа социально-экономических показателей применяются актуальные методы машинного обучения, на основе которых создаются современные инструменты для оценки функционирования социально-экономических систем. Одним из перспективных подходов машинного обучения является использование ансамблевых методов. Целью данного исследования стала разработка подхода для обработки панельных данных с помощью специальных регрессионных моделей, в том числе с применением ансамблей. Представлено разработанное клиент-серверное приложение, позволяющее реализовать и сравнить различные регрессионные модели, в частности модель GPBoost, для панельных данных, используемых в региональной статистике. Приложение апробировано на примере оценки инновационного потенциала российских регионов.

Благодарности: 
Исследование выполнено при финансовой поддержке РФФИ (проект № 20-010-00465).
Список источников: 
  1. Aivazian S. A. Metody ekonometriki [Methods of Econometrics]. Moscow, INFRA-M, 2019. 512 p. (in Russian).
  2. Greene W. H. Econometric Analysis. 5th ed. Upper Saddle River, NJ, Prentice Hall, 2003. 1026 p.
  3. Hajjem A., Bellavance F., Larocque D. Mixed-effects random forest for clustered data. Journal of Statistical Computation and Simulation, 2014, vol. 84, iss. 6, pp. 1313–1328. https://doi.org/10.1080/00949655.2012.741599
  4. Ke G., Meng Q., Finley T., Wang T., Chen W., Ma W., Liu T. Y. LightGBM: A highly efficient gradient boosting decision tree. Advances in neural information processing system, 2017, vol. 30, pp. 3146–3154.
  5. Firsova A., Chernyshova G. Efficiency analysis of regional innovation development based on DEA Malmquist index. Information, 2020, vol. 11, no. 6, 294. https://doi.org/10.3390/info11060294
  6. Veshneva I., Chernyshova G. The scenario modeling of regional competitiveness risks based on the Chapman-Kolmogorov equations. Journal of Physics: Conference Series (JPCS), 2021, vol. 1784, iss. 1, 012008. https://doi.org/10.1088/1742-6596/1784/1/012008
  7. Gurka M. J., Kelley G. A., Edwards L. J. Fixed and random effects models. Wiley Interdisciplinary Reviews: Computational Statistics, 2011, vol. 4, iss. 2, 181–190. https://doi.org/10.1002/wics.201
  8. Breiman L., Friedman J. H., Stone C. J., Olshen R. A. Classication and Regression Trees. 1st ed. New York, CRC Press, 1984. 368 p. https://doi.org/10.1201/9781315139470
  9. Laird N. M., Ware J. H. Random-effects models for longitudinal data. Biometrics, 1982, no. 38, pp. 963–974.
  10. Pinheiro J., Bates D. Mixed-Effects Models in S and S-PLUS. Springer Science & Business Media, 2006. 528 p.
  11. Rasmussen C. E., Williams C. K. J. Gaussian Processes for Machine Learning. The MIT Press, 2006. 266 p.
  12. Sigrist F. Gaussian Process Boosting. arXiv preprint arXiv, 2020.
  13. Baltagi B. H. Econometric Analysis of Panel Data. 6th ed. Chichester, John Wiley & Sons, 2021. 436 p.
  14. Information Analysis System FIRA PRO. Available at: https://pro.fira.ru (accessed 15 September 2021).
Поступила в редакцию: 
24.11.2021
Принята к публикации: 
21.12.2021
Опубликована: 
31.03.2022