О прогнозировании распространения covid-19

Прогнозы распространения коронавируса covid-19, динамика, тренды эпидемии и общее число погибших смотрите отдельно по каждой стране.

Прогнозы на сайте Коронавирус Хаб публикуются ежедневно, для расчетов используется машинное обучение на базе симулятора математической модели SEIR. Прогноз так же публикуется на сайте Центра по контролю и профилактике заболеваний США https://www.cdc.gov/coronavirus/2019-ncov/covid-data/forecasting-us.html и за это время показали себя как наиболее точные.

Точность прогнозирования публично отмечена доктором биологии Carl T. Bergstrom (о докторе на Вики) Вашингтонского университета https://twitter.com/CT_Bergstrom/status/1255343846445195266

А так же упоминалось в The New York Times https://www.nytimes.com/interactive/2020/05/12/upshot/coronavirus-models.html

Как работает симулятор

Официальные данные о распространении коронавируса (источник — Университет Джона Хопкинса) обрабатываются по модели SEIR. После чего входные и выходные данные анализируются с использованием методов машинного обучения, минимизируя ошибку между прогнозируемыми данными и фактическими результатами. Сила искусственного интеллекта учитывает десятки поправочных коэффициентов для каждой страны, прогнозируя распространение с максимальной точностью.

Как пользоваться прогнозами

На каждом из 6 графиков прогнозирования отображается верхняя граница – наихудший сценарий, нижняя граница – наилучший, штрихпунктирная — аппроксимированная усредненная линия.

прогноз распространения эпидемии пример

Прогноз сбудется в коридоре границ, достигая пиков и провалов между крайними границами. При успешном стечении обстоятельств развития эпидемии данные будут стремиться к нижней границе.

При расчетах учитывается кол-во тестирований в популяции и базовый индекс репродукции R0, что позволяет прогнозировать реальное кол-во инфицированных и погибших, а не только протестированных.

К каждому графику имеется подробное описание.

Математическая модель распространения эпидемии

Распространение эпидемий происходит по математическому закону SIR (Susceptible – подверженные заражению люди, Infectious – инфицированные, Recovered — вылечившиеся), разработанный в 20х годах прошлого столетия.

Модель предсказывает распространение болезни, общее число инфицированных, продолжительность эпидемии, оценивает различные эпидемиологические параметры, например, репродуктивное число R0. Модель показывает, как различные меры общественного здравоохранения влияют на исход эпидемии, каков наиболее эффективный метод для выпуска ограниченного числа вакцин в данной популяции и т.д.

Базовая SIR-модель и её продвинутые версии единственные практические модели, способные строить наиболее точные прогнозы. Подробнее на Вики.

SIR применима ко многим болезням: кори, паротиту (свинка), краснухе, которые являются воздушно-капельными детскими болезнями с пожизненным иммунитетом после выздоровления. Поэтому данная модель является достаточно прогностической для инфекционных заболеваний, передающиеся от человека к человеку.

модель sir для прогнозирования распространения эпидемий

SEIR — производная SIR с 4 группами: S, E, I и R.

  • S — число восприимчивых к инфекции особей
  • E – особи в стадии инкубационного периода патогена
  • I — инфицированные особи
  • R — выздоровевшие или умершие.

SEIR отличается от SIR наличием «латентного периода». В течение латентного (инкубационного периода) люди инфицированы, но не являются зараженными из-за инкубационного периода патогена. 

модель seir для прогнозирования распространения эпидемий

Для высокой точности прогнозирования требуется учитывать множество изменяющихся параметров:

  • скорость инфицирования
  • индекс репродукции
  • скорость выздоровления
  • изменяющиеся параметры карантинных ограничений и т.д.

На данный момент считается, что переболев коронавирусом covid-19 у человека вырабатывается иммунитет к повторному заражению. Однако если устойчивость к вирусу непостоянна, модель SIR преобразуется в SIS. Прогнозы на Коронавирус Хаб не учитывают возможность повторного заражения той же особью. Так же не учитывается вакцинация, дающая коллективный иммунитет обходя стадию массового заражения (вакцины пока нет).

Разработчики симулятора

Обильное наличие изменяющихся переменных требуют вычислительных мощностей и частых расчетов, а для точности прогнозов использование машинного обучения и навыков работы с ИИ.

Модель SEIR подробно описал Леонид Жуков, кандидат наук, профессор кафедры анализа данных и искусственного интеллекта, кафедра информатики Национального исследовательского университета «Высшая школа экономики». В прошлом – старший научный сотрудник Калифорнийского технологического института, работал в компании Yahoo:

Магистр Янг ГуРазработчик и автор прогнозов Youyang Gu (см. Вики), независимый исследователь данных. Youyang бакалавр Массачусетского технологического института (MIT) по специальности Electrical Engineering & Computer Science and Mathematics. Получил степень магистра, защитив диссертацию по обработке естественного языка в Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института.

https://scholar.google.com.au/citations?user=66tvlREAAAAJ&hl=ru