Для цитирования:
Chernyshova G. Y., Rasskazkin N. D. Software implementation of ensemble models for the analysis of regional socio-economic development indicators [Чернышова Г. Ю., Рассказкин Н. Д. Разработка приложения для реализации ансамблевых моделей в задаче анализа социально-экономических показателей] // Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика. 2022. Т. 22, вып. 1. С. 130-137. DOI: 10.18500/1816-9791-2022-22-1-130-137, EDN: XEKOIL
Software implementation of ensemble models for the analysis of regional socio-economic development indicators
[Разработка приложения для реализации ансамблевых моделей в задаче анализа социально-экономических показателей]
При решении задачи анализа социально-экономических показателей применяются актуальные методы машинного обучения, на основе которых создаются современные инструменты для оценки функционирования социально-экономических систем. Одним из перспективных подходов машинного обучения является использование ансамблевых методов. Целью данного исследования стала разработка подхода для обработки панельных данных с помощью специальных регрессионных моделей, в том числе с применением ансамблей. Представлено разработанное клиент-серверное приложение, позволяющее реализовать и сравнить различные регрессионные модели, в частности модель GPBoost, для панельных данных, используемых в региональной статистике. Приложение апробировано на примере оценки инновационного потенциала российских регионов.
- Aivazian S. A. Metody ekonometriki [Methods of Econometrics]. Moscow, INFRA-M, 2019. 512 p. (in Russian).
- Greene W. H. Econometric Analysis. 5th ed. Upper Saddle River, NJ, Prentice Hall, 2003. 1026 p.
- Hajjem A., Bellavance F., Larocque D. Mixed-effects random forest for clustered data. Journal of Statistical Computation and Simulation, 2014, vol. 84, iss. 6, pp. 1313–1328. https://doi.org/10.1080/00949655.2012.741599
- Ke G., Meng Q., Finley T., Wang T., Chen W., Ma W., Liu T. Y. LightGBM: A highly efficient gradient boosting decision tree. Advances in neural information processing system, 2017, vol. 30, pp. 3146–3154.
- Firsova A., Chernyshova G. Efficiency analysis of regional innovation development based on DEA Malmquist index. Information, 2020, vol. 11, no. 6, 294. https://doi.org/10.3390/info11060294
- Veshneva I., Chernyshova G. The scenario modeling of regional competitiveness risks based on the Chapman-Kolmogorov equations. Journal of Physics: Conference Series (JPCS), 2021, vol. 1784, iss. 1, 012008. https://doi.org/10.1088/1742-6596/1784/1/012008
- Gurka M. J., Kelley G. A., Edwards L. J. Fixed and random effects models. Wiley Interdisciplinary Reviews: Computational Statistics, 2011, vol. 4, iss. 2, 181–190. https://doi.org/10.1002/wics.201
- Breiman L., Friedman J. H., Stone C. J., Olshen R. A. Classication and Regression Trees. 1st ed. New York, CRC Press, 1984. 368 p. https://doi.org/10.1201/9781315139470
- Laird N. M., Ware J. H. Random-effects models for longitudinal data. Biometrics, 1982, no. 38, pp. 963–974.
- Pinheiro J., Bates D. Mixed-Effects Models in S and S-PLUS. Springer Science & Business Media, 2006. 528 p.
- Rasmussen C. E., Williams C. K. J. Gaussian Processes for Machine Learning. The MIT Press, 2006. 266 p.
- Sigrist F. Gaussian Process Boosting. arXiv preprint arXiv, 2020.
- Baltagi B. H. Econometric Analysis of Panel Data. 6th ed. Chichester, John Wiley & Sons, 2021. 436 p.
- Information Analysis System FIRA PRO. Available at: https://pro.fira.ru (accessed 15 September 2021).
- 1870 просмотров