БИОМЕДИЦИНСКИЙ ЖУРНАЛ МЕДЛАЙН.РУ
Содержание журнала

Архив

Редакция
Учредители

Федеральное государственное бюджетное учреждение «Научно-клинический центр токсикологии имени академика С.Н. Голикова Федерального медико-биологического агентства»


Федеральное государственное бюджетное учреждение науки
Институт теоретической и экспериментальной биофизики
Российской академии наук


ООО "ИЦ КОМКОН"

Адрес редакции и реквизиты

199406, Санкт-Петербург, ул.Гаванская, д. 49, корп.2

ISSN 1999-6314


Профилактическая медицина •

Том: 22
Статья: « 23 »
Страницы:. 328-343
Опубликована в журнале: 15 мая 2021 г.

English version

Классификация эпидемиологических прогнозов и применение градиентного бустинга в профилактической медицине

Голубков А.В., Гаврилова М.П.

Федеральное государственное казенное учреждение Главный центр
государственного санитарно-эпидемиологического надзора (специального назначения) Министерства обороны Российской Федерации
Федеральное государственное бюджетное учреждение Санкт-Петербургский научно-исследовательский институт физической культуры


Резюме
В статье предложена новая обоснованная классификация эпидемиологических прогнозов острых респираторных инфекций. Приведены сведения об использовании алгоритмов машинного обучения в различных сферах деятельности человека. Показаны примеры применения метода градиентного бустинга в области клинической медицины с целью прогнозирования соматической заболеваемости. Освещена актуальность применения градиентного бустинга в прогнозе уровней заболеваемости инфекционными болезнями и болезнями органов дыхания. Предложена разработка и осуществление прогноза острых респираторных инфекций в организованных коллективах Вооруженных Сил Российской Федерации с предварительным определением предикторов.


Ключевые слова
машинное обучение, градиентный бустинг, ретроспективный эпидемиологический анализ, прогнозирование, прогноз заболеваемости, острые респираторные инфекции, организованные коллективы, Вооруженные Силы Российской Федерации.



(статья в формате PDF. Для просмотра необходим Adobe Acrobat Reader)



открыть статью в новом окне

Список литературы

1. Абрамович, М.С. Применение ансамблей деревьев решений для прогнозирования эффективности лечения хронической сердечной недостаточности / М.С. Абрамович, Е.C. Атрощенко, Д.В. Романовский, О.В. Кошлатая // Материалы международного конгресса по информатике: информационные системы и технологии Минск, 24-27 октября 2016 года. Издательство: Белорусский государственный университет, Минск. 2016. С. 406-410.


2. Бочкарев, Б.В. Исследование применимости методов машинного обучения на основе решающих деревьев для анализа электрокардиосигналов / Б.В. Бочкарев, А.А. Ракитский // Труды XVII Международной конференции DICR-2019, Новосибирск, 3-6 декабря 2019 г. Новосибирск 2019. С.42-47.


3. Ветров, Д.П. Байесовские методы машинного обучения: учебное пособие по спецкурсу / Д.П. Ветров, Д.А. Кропотов. - 2007.


4. Голубков, А.В. Применение искусственных нейронных сетей в профилактической и клинической медицине (научный обзор) / А.В. Голубков, М.П. Гаврилова // Профилактическая и клиническая медицина. 2020. 4 (77). С. 30-39. DOI: 10.47843/2074-9120_2020_4_30.


5. Горшенин, А.К. Гибридные модели экстремального градиентного бустинга для восстановления пропущенных значений в данных об осадках / А.К. Горшенин, О.П. Мартынов // Информ. и ее примен. 2019, Т. 13. Вып. 3. С. 34-40. DOI: 10.14357/19922264190306


6. Демография в России: Сборник Федеральной службы государственной статистики. https://rosstat.gov.ru/folder/12781/ (дата обращения: 09.03.2021)


7. Евдокимов, В.И. анализ первичной заболеваемости военнослужащих по призыву военно-морского флота и сухопутных войск России за последние 10 лет (2010-2019 гг.) /В.И. Евдокимов, П.П. Сиващенко // Морская медицина. 2020. Т. 6. 4. С. 63-72. DOI: 10.22328/2413-5747-2020-6-4-63-72.


8. Здравоохранение в России - 2011 г. - URL: https://rosstat.gov.ru/bgd/regl/B11_34/Main.htm/ (дата обращения: 15.04.2021)


9. Здравоохранение в России - 2013 г. - URL: https://rosstat.gov.ru/bgd/regl/B13_34/Main.htm/ (дата обращения: 15.04.2021)


10. Здравоохранение в России - 2015 г. - URL: https://rosstat.gov.ru/bgd/regl/B15_34/Main.htm/ (дата обращения: 15.04.2021)


11. Здравоохранение в России - 2017 г. - URL: https://rosstat.gov.ru/bgd/regl/B17_34/Main.htm/ (дата обращения: 15.04.2021)


12. Здравоохранение в России - 2019 г. - URL: https://rosstat.gov.ru/bgd/regl/b19_34/Main.htm/ (дата обращения: 15.04.2021)


13. Здравоохранение в России: Сборник Федеральной службы государственной статистики. https://rosstat.gov.ru/folder/210/document/13218/ (дата обращения: 09.03.2021)


14. Ильясов, Э.С. Применение модели градиентного бустинга для прогнозирования развития диабета/ Э.С. Ильясов // Молодой ученый. 2016. 27. С. 1-5. - URL: https://moluch.ru/archive/131/36581/ (дата обращения: 20.03.2021)


15. Китова, О.В. Метод машин опорных векторов для прогнозирования показателей инвестиций / О.В. Китова, И.Б. Колмаков, И.А. Пеньков // Экономика, Статистика и Информатика. - 2016. - 4. - С. 27-30.


16. Кондратьев, М.А. Методы прогнозирования и модели распространения заболеваний. / М.А. Кондратьев. // Компьютерные исследования и моделирование. 2013. Т. 5. 5. С. 863-882.


17. Мельниченко, П.И. Ретроспективный эпидемиологический анализ и прогнозирование заболеваемости личного состава Вооруженных сил Российской Федерации: метод. указания / П.И. Мельниченко [и др.]. М.: Воениздат, 2006. 143 с.


18. Наставление по Глобальной системе обработки данных и прогнозирования. Дополнение IV к Техническому регламенту ВМО. ВМО- 485. Женева, Швейцария. 2017. 123 с.


19. О состоянии санитарно-эпидемиологического благополучия населения в Российской Федерации в 2012 году: Государственный доклад. М.: Федеральная служба по надзору в сфере защиты прав потребителей и благополучия человека, 2013. 176 с. - URL: https://www.rospotrebnadzor.ru/upload/iblock/7cd/gosudarstvennyy-doklad-o-sostoyanii-sanitarno_epidemiologicheskogo-blagopoluchiya-naseleniya-v-rossiyskoy-federatsii-v-2012-godu.pdf/ (дата обращения: 15.04.2021)


20. О состоянии санитарно-эпидемиологического благополучия населения в Российской Федерации в 2013 году: Государственный доклад. М.: Федеральная служба по надзору в сфере защиты прав потребителей и благополучия человека, 2014. 191 с. - URL: https://www.rospotrebnadzor.ru/upload/iblock/3b8/gd_2013_dlya-sayta.pdf/ (дата обращения: 15.04.2021)


21. О состоянии санитарно-эпидемиологического благополучия населения в Российской Федерации в 2014 году: Государственный доклад. М.: Федеральная служба по надзору в сфере защиты прав потребителей и благополучия человека, 2015. 206 с. - URL: https://www.rospotrebnadzor.ru/upload/iblock/22c/gd_2014_seb_dlya-sayta.pdf/ (дата обращения: 15.04.2021)


22. О состоянии санитарно-эпидемиологического благополучия населения в Российской Федерации в 2015 году: Государственный доклад. ? М.: Федеральная служба по надзору в сфере защиты прав потребителей и благополучия человека, 2016. 200 с. - URL: https://www.rospotrebnadzor.ru/upload/iblock/486/gd_2015_ds.pdf/ (дата обращения: 15.04.2021)


23. О состоянии санитарно-эпидемиологического благополучия населения в Российской Федерации в 2016 году: Государственный доклад. М.: Федеральная служба по надзору в сфере защиты прав потребителей и благополучия человека, 2017. 220 с. - URL: https://www.rospotrebnadzor.ru/upload/iblock/0b3/gosudarstvennyy-doklad-2016.pdf/ (дата обращения: 15.04.2021)


24. О состоянии санитарно-эпидемиологического благополучия населения в Российской Федерации в 2017 году: Государственный доклад. М.: Федеральная служба по надзору в сфере защиты прав потребителей и благополучия человека, 2018. 268 с. - URL: https://www.rospotrebnadzor.ru/upload/iblock/d9d/gd_2017_seb.pdf/ (дата обращения: 15.04.2021)


25. О состоянии санитарно-эпидемиологического благополучия населения в Российской Федерации в 2018 году: Государственный доклад. М.: Федеральная служба по надзору в сфере защиты прав потребителей и благополучия человека, 2019. 254 с. - URL: https://www.rospotrebnadzor.ru/upload/iblock/798/gosudarstvennyy-doklad-o-sostoyanii-sanitarno_epidemiologicheskogo-blagopoluchiya-naseleniya-v-rossiyskoy-federatsii-v-2018-godu.pdf/ (дата обращения: 15.04.2021)


26. Прогнозирование заболеваемости геморрагической лихорадкой с почечным синдромом (Пуумала) с использованием статитстических методов: учеб.-метод. пособие для практ. занятий / Ю.Л. Минаев, В.Г. Морозов, С.И. Коломинов, Г.Д. Коробов; НОУ ВПО СМИ «РЕАВИЗ» Самара: НОУ ВПО СМИ «РЕАВИЗ», 2011. 44 с.


27. Прогностика: терминология / Акад. наук СССР, Ком. науч.-техн. терминологии; отв. ред. В. И. Сифоров. - Москва: Наука, 1990. 2019 54 с. - ISBN 5-02-006645-1.


28. РД 52.27.724-2019. Наставление по краткосрочным прогнозам погоды общего назначения: дата введения 2019-06-25 / Федеральная служба по гидрометеорологии и мониторингу окружающей среды. Изд. Официальное. - Москва: ФГБУ «Гидрометцентр России», 2019. 66 с.


29. Салахутдинова, К.И. Алгоритм градиентного бустинга деревьев решений в задаче идентификации программного обеспечения / К.И. Салахутдинова, И.С. Лебедев, И.Е. Кривцова // Научно-технический вестник информационных технологий, механики и оптики. 2018. Т. 18. 6. С. 1016-1022. DOI: 10.17586/2226-1494-2018-18-6-1016-1022.


30. Сахибгареева, М.В. разработка системы прогнозирования диагнозов заболеваний на основе искусственного интеллекта / М.В. Сахибгареева , А.Ю. Заозерский // Вестник РГМУ. 2017. 6. С.


31. Слободенюк, А.В. Эпидемиологический анализ: учеб. пособие / А.В. Слободенюк, А.А. Косова, Р.Н. Ан; ГБОУ ВПО УГМУ. - Екатеринбург: изд-во ГБОУ ВПО УГМУ, 2015. - 36 с.


32. Социально-экономическое положение России. Январь 2020 (1): Сборник Федеральной службы государственной статистики. - URL: https://rosstat.gov.ru/storage/mediabank/osn-01-2020.pdf/ (дата обращения: 24.04.2021)


33. Тусаева, А.Р. Применение корреляционно-регрессионного метода в оценке уровня заболеваемости Курской области. / А.Р. Тусаева, А.В. Гаврилова. // Молодой ученый. 2017. 4 (138). С. 541-544. URL: https://moluch.ru/archive/138/38666/ (дата обращения: 02.05.2021).


34. Фролов, А.И. Анализ алгоритма градиентного бустинга для целей прогнозирования / А.И. Фролов // Альманах научных работ молодых ученых Университета ИТМО. XLVIII научная и учебно-методическая конференция Университета ИТМО / Издательство: ФГАОУ ВО «Национальный исследовательский университет ИТМО» Санкт-Петербург, 2019. С. 285-288.


35. Шульгин, С.Г. Отбор переменных для анализа и прогнозирования нестабильности с помощью моделей градиентного бустинга / С.Г. Шульгин // Системный мониторинг глобальных и региональных рисков. Социально-политическая и экономическая дестабилизация: анализ страновых и региональных ситуаций в мир-системном аспекте / Издательство «Учитель» Волгоград, 2018. Т. 9. С. 115?153.


36. Янчевская, Е.Ю. Математическое моделирование и прогнозирование в эпидемиологии инфекционных заболеваний / Е.Ю. Янчевская, О.А. Меснянкина // Вестник Российского университета дружбы народов. Серия: Медицина. 2019. Т. 23. 3 С. 328-334. DOI: 10.22363/2313-0245-2019-23-3-328-334.


37. Aler R., Galvan I. M., Ruiz-Arias J. A., Gueymard C. A. Improving the separation of direct and diffuse solar ra- diation components using machine learning by gradient boosting // Sol. Energy, 2017. Vol. 150. P. 558-569.


38. Blaser R., Fryzlewicz P. Random Rotation Ensembles // Journal of Machine Learning Research 17 / 2016. c. 1-26.


39. Chatzis, S.P., Siakoulis V., Petropoulos A., Stavroulakis E., Vlachogiannakis N. Forecasting stock market crisis events using deep and statistical machine learning techniques // Expert Syst. Appl., 2018. Vol. 112. P. 353-371.


40. Chen, T., and Guestrin, C. (2016). «XgBoost: A Scalable Tree Boosting System» in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785-794. doi: 10.1145/2939672.2939785


41. Friedman, J.H. Greedy function approximation: a gradient boosting machine. The Annals of Statistics 2001; 29(5): 1189-1232 URL: https://doi.org/10.1214/aos/1013203451/ (дата обращения: 15.03.2021)


42. Harrell FE. Regression modeling strategies: With applications to linear models, logistic regression, and survival analysis. Springer, New York; 2001


43. Henzel, J. Gradient Boosting Application in Forecasting of Performance Indicators Values for Measuring the Efficiency of Promotions in FMCG Retail / J. Henzel, M. Sikora // arXiv:2006.04945v1 [cs.CY] 30 May 2020


44. Hosmer, D.W., Lemeshow, S. Applied Logistic Regression. New York:Wiley 1989.


45. Mustapha, I. B., and F. Saeed. Bioactive molecule prediction using extreme gradient boosting. Molecules 2016. 21(8):983.


46. Natekin A., Knoll A. Gradient boosting machines, a tutorial. Front Neurorobot 2013; 7: 21, https://doi.org/10.3389/ fnbot.2013.00021.


47. Paulo Celio Di Cellio Dias, Melissa Forti, Marc Witarsa // A comparison of Gradient Boosting with Logistic Regression in Practical Cases. - URL: https://www.sas.com/content/dam/SAS/support/en/sas-global-forum-proceedings/2018/1857-2018.pdf/ (дата обращения: 19.04.2021)


48. Prokhorenkova, L., Gusev G., Vorobev A., Dorogush A.V., Gulin A. CatBoost: Unbiased boosting with categorical features. 2018. Adv. Neur. In. 31:6638-6648


49. Shalev-Shwartz S, Ben-David S. Understanding Machine Learning: From Theory to Algorithms. New York: Cambridge University Press; 2014. 410 p.


50. Hastie, T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Prediction, Inference and Data Mining (Second Edition). Springer Verlag, New York, 2009.


51. Torres-Barran, A., Alonso A., Dorronsoro J. R. Regression tree ensembles for wind energy and solar radiation predic- tion // Neurocomputing, 2018. Vol. 326. P. 151-160.


52. Xia, Y., Liu C., Li Y., Liu N. A boosted decision tree approach using Bayesian hyper-parameter optimization for credit scoring // Expert Syst. Appl., 2017. Vol. 78. P. 225-241.


53. Zhang, D. A data-driven design for fault detection of wind turbines using random forests and XGboost / D. Zhang [et al.] // IEEE Access, 2018. Vol. 6. P. 21020-21031.


54. Zhang, Z. Predictive analytics with gradient boosting in clinical medicine / Z. Zhang [et al.] // Ann Transl Med 2019;7(7):152. doi: 10.21037/atm.2019.03.29.