Краткосрочное прогнозирование показателей смертности на основе оперативных данных методом машинного обучения

  • Александр Владимирович Гусев ФГБУ «Центральный научно-исследовательский институт организации и информатизации здравоохранения» Министерства здравоохранения Российской Федерации
  • Анна Евгеньевна Андрейченко ООО «К-Скай»
  • Михаил Юрьевич Котловский ФГБУ «Центральный научно-исследовательский институт организации и информатизации здравоохранения» Министерства здравоохранения Российской Федерации
  • Тарас Денисович Тарасенко ФГБУ «Центральный научно-исследовательский институт организации и информатизации здравоохранения» Министерства здравоохранения Российской Федерации
  • Иван Анатольевич Деев ФГБУ «Центральный научно-исследовательский институт организации и информатизации здравоохранения» Министерства здравоохранения Российской Федерации
  • Ольга Сергеевна Кобякова ФГБУ «Центральный научно-исследовательский институт организации и информатизации здравоохранения» Министерства здравоохранения Российской Федерации
Ключевые слова: смертность населения, причины смерти, индивидуальные деперсонифицированные данные о смертности, пандемия COVID-19, цифровое здравоохранение, искусственный интеллект, машинное обучение, системы поддержки принятия решений

Аннотация

В исследовании была рассмотрена возможность создания и сравнения краткосрочных предиктивных моделей смертности населения региона в ковидный период (2020) и до него (2019) с использованием алгоритма машинного обучения (CatBoost). Использовали оперативные данных о числе умерших Федеральной службы государственной статистики и дополнительно справочники субъектов РФ (демографические и общегеографические данные, сведения о медицинских организациях, показатели системы здравоохранения, медицинские мониторинги, показатели рисков опасностей и др.). Для данных 2019 г. ошибка модели уменьшалась с увеличением периода обучения с 13 до 0,5%. В 2020 г. данного уменьшения не наблюдалось, и ошибка варьировалась между 8 и 16%. Не удалось повысить точность прогнозов при присоединении характеристик регионов. Агрегированные данные имели черты случайного процесса, и отсутствовали предикторы, имеющие значимое влияние на причины смертности или значимо ассоциированные с ними.

Скачивания

Данные скачивания пока не доступны.

Литература

Колесников А.С., Сапегин С.В. (2019). Использование технологии машинного обучения Catboost для планирования сервисного обслуживания грузовой спецтехники. В Информатика: проблемы, методология, технологии: сборник материалов XIX международной научно-методической конференции (сс. 1479–1484). Воронеж: Издательство «Научно-исследовательские публикации».

Лифшиц М.Л. (2021). Смертность в России в первый год пандемии covid-19 и потенциальные демографические последствия. В Парадигмы и модели демографического развития : сборник статей XII Уральского демографического форума, Том 1 (сс. 246–253). Екатеринбург: ИЭ УрО РАН.

Ahlburg D.A., Lutz W. (1998). Introduction: The Need to Rethink Approaches to Population Forecasts. Population and Development Review, 24, 1–14. https://doi.org/10.2307/2808048

Bravo J.M. (2021). Forecasting mortality rates with Recurrent Neural Networks: A preliminary investigation using Portuguese data. In CAPSI 2021 Proceedings: 21ª Conferência da Associação Portuguesa de Sistemas de Informação, "Sociedade 5.0: Os desafios e as Oportunidades para os Sistemas de Informação" (pp. 1-19).

Deprez P., Shevchenko P.V., Wüthrich M.V. (2017). Machine learning techniques for mortality modeling. European Actuarial Journal, 7, 337–352. https://doi.org/10.1007/s13385-017-0152-4

Dorogush A.V., Ershov V., Gulin A. (2018). CatBoost: gradient boosting with categorical features support. https://doi.org/10.48550/arXiv.1810.11363

Hainaut D. (2018). A neural-network analyzer for mortality forecast. ASTIN Bulletin: The Journal of the IAA, 48, 481–508. https://doi.org/10.1017/asb.2017.45

Lee R.D., Carter L.R. (1992). Modeling and Forecasting U. S. Mortality. Journal of the American Statistical Association, 87, 659–671. https://doi.org/10.2307/2290201

Levantesi S., Pizzorusso V. (2019). Application of Machine Learning to Mortality Modeling and Forecasting. Risks, 7(1), 26. https://doi.org/10.3390/risks7010026

Perla F., Richman R., Scognamiglio S., Wüthrich M.V. (2021). Time-series forecasting of mortality rates using deep learning. Scandinavian Actuarial Journal, 7, 572–598. https://doi.org/10.1080/03461238.2020.1867232

Richman R., Wüthrich M.V. (2021). A neural network extension of the Lee-Carter model to multiple populations. Annals of Actuarial Science, 15(2), 346–366. https://doi.org/10.1017/S1748499519000071

Rizzi S., Vaupel J.W. (2021). Short-term forecasts of expected deaths. The Proceedings of the National Academy of Sciences, 118(15), 1–7. https://doi.org/10.1073/PNAS.2025324118

Wang H., Paulson K.R., Pease S.A. et al. (2022). Estimating excess mortality due to the COVID-19 pandemic: a systematic analysis of COVID-19-related mortality, 2020–21. Lancet, 399, 1513–1536. https://doi.org/10.1016/S0140-6736(21)02796-3

Опубликован
2023-08-01
Как цитировать
Гусев А. В., Андрейченко А. Е., Котловский М. Ю., Тарасенко Т. Д., Деев И. А., & Кобякова О. С. (2023). Краткосрочное прогнозирование показателей смертности на основе оперативных данных методом машинного обучения. Демографическое обозрение, 10(2), 132-142. https://doi.org/10.17323/demreview.v10i2.17768
Раздел
Оригинальные статьи