Більш детальний погляд на повідомлення про кількість коронавірусів у перспективах

Аналіз номерів справ відповідно до розмірів країни

Відмова від відповідальності: Назустріч Data Science - це середня публікація, заснована насамперед на основі вивчення даних про дані та машинного навчання. Ми не медичні працівники чи епідеміологи, і думки цієї статті не слід тлумачити як професійні поради. Щоб дізнатися більше про пандемію коронавірусу, ви можете натиснути тут.

За декілька місяців коронавірус (COVID-19) поширився по всьому світу, що призвело до фактичної глобальної пандемії. У багатьох країнах та регіонах підтверджені випадки все ще зростають експоненціально. Слідом за повідомленнями про підтверджені кількості випадків щодня, я дуже стурбований тим, як вірус впливає на життя людей, ринки та глобальну економіку. Родом з Пекіна, Китай, пам'ять про спалах ВРВІ 2003 року залишається свіжою. Однак я був здивований, коли багато людей на Заході настільки байдужі до тяжкості COVID-19: "Це просто грип", "він впливає лише на старих людей", "медіа-пропаганду", "імунітет стада" ... Ці висоти від широкої публіки тримають мене за ночами.

Можливо, деякі люди не вражені зареєстрованою кількістю випадків і вважають, що більшість заражених випадків знаходяться далеко в іншому куточку світу. Я згоден, справді дивлячись на ці підтверджені номери справ абстрактні. Тут я зробив кілька сюжетів, щоб поставити ці цифри в перспективи.

Застереження: модель є такою ж хорошою, як і джерело даних. Усі підтверджені випадки COVID-19 надає Центр системних наук та інженерії Університету Джона Хопкінса (JHU CSSE), який склав офіційно повідомлені номери ВООЗ та урядів усього світу. Без сумніву, у більшості країн є недостатня звітність через відсутність діагностичних тестів, непрозорість урядів та люди, які не знають тестування через незнання.

Усі наведені нижче дані базуються на підтверджених випадках COVID-19 станом на 15 березня 2020 року.

Нагромаджені випадки на рівні регіону

Країни / регіони, які найбільше постраждали, за сукупністю підтверджених випадків COVID-19

Багато візуалізацій (таких як ця) показують лише статистику на рівні країни. З сюжету на рівні регіону ми можемо відокремити різні провінції Китаю та штати США. Хубей, колись епіцентр COVID-19, разом із майже всіма іншими провінціями Китаю, зменшився у кількості підтверджених випадків. Іран, Південна Корея, Італія, поряд з багатьма європейськими країнами перевершили багато Гуандун, 2-у найбільш постраждалу китайську провінцію.

Встановлення експоненціального зростання

Далі розглянемо, як швидко COVID-19 поширюється в регіонах. Я встановив кумулятивні підтверджені випадки експоненціальною функцією, y = exp (a + bx). Тут я використав звичайний найменший квадрат (OLS) для визначення параметрів a і b, нахил b відповідає крутості експоненціальної кривої.

Насправді майже нічого не слідкує за експоненціальним зростанням нескінченно. Однак початковий спалах інфекційного захворювання можна моделювати за допомогою експоненціальної функції. Для різних регіонів я встановив накопичену кількість підтверджених випадків COVID-19 за цей початковий період, що визначається числом 50 випадків принаймні від 5 до 10 днів. Сортувавши пристосовані схили (b) від експоненціальних функцій, я виявив вражаючий список країн із темпами зростання, що перевищують Хубей, навколо закриття на 01/23, включаючи Іран, Фінляндію, Португалію, Італію, Південну Корею, Данію, Словенію та Іспанію багато з яких зараз зазнають експоненціального зростання (станом на 15 березня). Крім того, штати Нью-Йорк та Вашингтон у США також посіли 15 та 19 місце серед найшвидше розповсюджених регіонів світу.

Регіони / країни, що найшвидше розповсюджуються. Легенда вказує на b в експоненціальній функції та періоді дати, що використовується для підгонки кривої зростання.

З іншого боку, ми також можемо виявити регіони та країни з найповільнішим розповсюдженням COVID-19. Топ-20 майже виключно в Азії, багато з яких - віддалені та малонаселені провінції Китаю, такі як Нінся, Внутрішня Монголія та Сіньцзян. Слід зазначити, що випадки COVID-19 існують у Сінгапурі та Японії з середини лютого, проте розповсюджуються набагато повільніше, ймовірно, через раннє та ефективне впровадження соціального дистанціювання.

Найменш розповсюджені регіони / країни.

Нормалізувати чисельність населення

Один із способів вивести кількість заражених людей на перспективу - це нормалізувати її відповідно до чисельності населення регіону чи країни. Нижче я описую топ-20 регіонів / країн з найбільшим відсотком населення, зараженим COVID-19. Сан-Марино, анклавована мікродержава, оточена Італією, посіла перше місце за щільністю COVID-19. Інші країни з низьким рівнем населення, такі як Ісландія, також очолюють список.

Нормалізувати за площею

Ще один спосіб зрозуміти кількість заражених людей - це нормалізація щодо району регіону / країни для отримання щільності випадків з точки зору географії. Знову ж таки, Сан-Марино очолює список із-за невеликої площі. Багато міст та міських штатів також входять до числа найкращих: Макао, Сінгапур та Вашингтон.

Нормалізувати до працездатності лікарні

Більш ефективним способом вивести кількість випадків COVID-19 в перспективу є кількісна оцінка його тягаря для лікарень у регіонах. Це можна зробити, нормалізуючи залежність від лікарняної спроможності, яка вимірюється приблизною кількістю лікарняних ліжок.

Поточним зараженим COVID-19 пацієнтами достатньо, щоб зайняти 72% лікарняних ліжок у Сан-Марино, де є лише одна лікарня. Інші країни з дуже високим навантаженням включають Ісландію, Іран, Італію та Катар: пацієнти із COVID-19 приймають понад 10% лікарняних ліжок. Зауважте, що це, мабуть, найкращий сценарій, коли пацієнти пропорційно розподіляються по лікарнях, щоб вони не переливались до однієї лікарні.

Слід також врахувати кількість ліжок у відділеннях інтенсивної терапії та кількість наявних механічних вентиляторів, які мають важливе значення для порятунку пацієнтів із важкими симптомами. За даними Американської асоціації госпіталів, на ліжка в МКБ припадає ~ 5% усіх лікарняних ліжок у США. Якщо припустити, що всім цим пацієнтам знадобиться перебування у відділеннях інтенсивної терапії, ~ 10% лікарняних ліжок стають страшними ~ 200%.

Оновлено тягар лікарні на підставі підтверджених випадків до 21 березня

Мені вдалося оцінити лікарняні ліжка для штатів у США, використовуючи дані звідси. Як видно з сюжету, підтверджені випадки в Сан-Марино вже перевищили кількість лікарняних ліжок. Шпитальний тягар Італії підскочив до ~ 23%. Три штати в США, Нью-Йорк, Вашингтон та Нью-Джерсі також посіли у топ-20, причому 16%, 12% та 4% усіх лікарняних ліжок потенційно зайняті підтвердженими випадками COVID-19, припускаючи, що всі потребують госпіталізації.

Коди:

https://github.com/wangz10/covid_19_analyses