Bližší pohľad na uvedené počty koronavírusov v perspektívach

Analýzy čísel prípadov s ohľadom na veľkosti krajiny

Zrieknutie sa zodpovednosti: Towards Data Science je publikácia Medium, ktorá vychádza predovšetkým zo štúdia údajov a strojového učenia. Nie sme odborníci na zdravie alebo epidemiológovia a stanoviská tohto článku by sa nemali interpretovať ako odborné rady. Ak sa chcete dozvedieť viac o pandémii koronavírusov, kliknite sem.

Len za pár mesiacov sa koronavírus (COVID-19) rozšíril do celého sveta, čo vedie k de facto globálnej pandémii. V mnohých krajinách a regiónoch potvrdené prípady stále exponenciálne rastú. Po dennom hlásení potvrdených čísel prípadov ma veľmi znepokojuje to, ako vírus ovplyvňuje život ľudí, trhy a globálnu ekonomiku. Pôvodne z Pekingu v Číne zostáva spomienka na vypuknutie SARS v roku 2003 svieža. Bol som však prekvapený, keď som zistil, že toľko ľudí na Západe je natoľko ľahostajných voči závažnosti dokumentu COVID-19: „Je to iba chrípka“, „ovplyvňuje to iba starých ľudí“, „mediálnu propagandu“, „imunitu stáda“… Tie nadmorské výšky od širokej verejnosti ma v noci udržiavajú.

Možno, že niektorí ľudia nie sú ohlasovaní počtom hlásených prípadov a myslia si, že väčšina infikovaných prípadov je ďaleko na druhej strane sveta. Súhlasím s tým, že tie potvrdené čísla prípadov sú abstraktné. Tu som urobil niekoľko grafov, aby som tieto čísla dal do perspektív.

Upozornenie: model je iba taký dobrý ako zdroj údajov. Všetky potvrdené prípady COVID-19 poskytuje Centrum pre vedu a techniku ​​Johns Hopkins University (JHU CSSE), ktoré zostavilo oficiálne hlásené čísla od WHO a vlád po celom svete. Vo väčšine krajín je nepochybne nedostatočné podávanie správ z dôvodu nedostatku diagnostických testov, nedostatočnej transparentnosti zo strany vlád a ľudí, ktorí nevykonali test z dôvodu nevedomosti.

Všetky nižšie uvedené čísla vychádzajú z potvrdených prípadov COVID-19 k 15. marcu 2020.

Kumulované prípady na úrovni regiónov

Najlepšie postihnuté krajiny / regióny podľa kumulovaných potvrdených prípadov COVID-19

Mnoho vizualizácií (ako je táto) zobrazuje iba štatistiku na úrovni krajiny. Z grafu na úrovni regiónu môžeme oddeliť rôzne provincie Číny a štáty v USA. Hubei, kedysi epicentrum COVID-19, spolu s takmer všetkými ostatnými provinciami v Číne, sa v mnohých potvrdených prípadoch vyrovnal. Irán, Južná Kórea, Taliansko spolu s mnohými európskymi krajinami prekonali mnohé Guangdong, druhé najťažšie postihnuté čínske provincie.

Prispôsobenie sa exponenciálnemu rastu

Ďalej sa pozrime, ako rýchlo sa COVID-19 rozšíril v rámci regiónov. Kumulatívne potvrdené prípady som vybavil exponenciálnou funkciou, y = exp (a + bx). Tu som použil obyčajný najmenší štvorec (OLS) na určenie parametrov aab, sklon b zodpovedá strmosti exponenciálnej krivky.

V skutočnosti takmer nič nenasleduje exponenciálny rast donekonečna. Počiatočné ohnisko infekčnej choroby sa však dá modelovať s exponenciálnou funkciou. Pre rôzne regióny som použil kumulovaný počet potvrdených prípadov COVID-19 počas tohto počiatočného obdobia, definovaného tým, že mám 50 prípadov najmenej 5 až 10 dní. Vytriedením upravených svahov (b) od exponenciálnych funkcií som našiel pozoruhodný zoznam krajín s mierou rastu vyššou ako Hubei okolo uzamknutia 01/23 vrátane Iránu, Fínska, Portugalska, Talianska, Južnej Kórey, Dánska, Slovinska a Španielska. , z ktorých mnohé teraz zažívajú exponenciálny rast (k 15. marcu). Okrem toho sa štát v New Yorku a Washingtone v USA zaradil medzi 15 a 19 medzi najrýchlejšie sa rozvíjajúce regióny na svete.

Najrýchlejšie sa šíriace regióny / krajiny. Legenda označuje b v exponenciálnej funkcii a časové obdobie použité na prispôsobenie rastovej krivky.

Na druhej strane môžeme objaviť aj regióny a krajiny s najpomalším šírením COVID-19. Dvadsať najlepších je takmer výlučne v Ázii, z ktorých mnohé sú odľahlé a menej obývané provincie v Číne, ako napríklad Ningxia, Vnútorné Mongolsko a Sin-ťiang. Za zmienku stojí, že prípady COVID-19 existujú v Singapure a Japonsku od polovice februára, ale sa šíria oveľa pomalšie, pravdepodobne v dôsledku včasného a účinného vykonávania sociálneho dištancovania.

Najpomalšie sa rozvíjajúce regióny / krajiny.

Normalizovať na populáciu

Jedným zo spôsobov, ako dať do pozornosti počet infikovaných ľudí, je normalizovať ich vzhľadom na veľkosť populácie v regióne alebo krajine. Nižšie uvádzam graf 20 najlepších regiónov / krajín s najväčším percentom populácie infikovanej vírusom COVID-19. San Maríno, enklávny mikrostavát obklopený Talianskom, sa umiestnil na prvom mieste v hustote COVID-19 podľa populácie. Na zozname sa nachádzajú aj ďalšie krajiny s nízkym počtom obyvateľov, ako napríklad Island.

Normalizovať na oblasť

Ďalším spôsobom, ako zistiť počet infikovaných ľudí, je normalizácia proti oblasti regiónu / krajiny, aby sa odvodila hustota prípadov z hľadiska geografie. Sanmaríno je opäť na prvom mieste zoznamu kvôli malej rozlohe. Mnohé mestá a mestské štáty sú tiež medzi špičkami: Macao, Singapur a Washington DC.

Normalizujte kapacitu nemocnice

Efektívnejší spôsob, ako dať do úvahy počet prípadov COVID-19, je vyčísliť zaťaženie nemocníc v rámci regiónov. To sa dá dosiahnuť normalizáciou oproti kapacite nemocnice, ktorá sa meria odhadovaným počtom nemocničných postelí.

Súčasní pacienti infikovaní COVID-19 postačujú na obsadenie 72% nemocničných lôžok v San Maríne, ktoré má iba jednu nemocnicu. Medzi ďalšie krajiny s veľmi vysokou záťažou patria Island, Irán, Taliansko a Katar, pričom pacienti COVID-19 preberajú 10% nemocničných postelí. Upozorňujeme, že to predpokladá najlepší prípad, keď sú pacienti rovnomerne rozmiestnení v nemocniciach, aby sa do jednej nemocnice nedostali.

Mali by ste zvážiť aj počet lôžok na JIS a počet dostupných mechanických ventilátorov, ktoré sú nevyhnutné na záchranu pacientov so závažnými príznakmi. Podľa Americkej asociácie nemocníc tvoria postele v ICD ~ 5% všetkých nemocničných postelí v USA. Za predpokladu, že by všetci títo pacienti potrebovali pobyt na JIS, ~ 10% nemocničných postelí sa stane strašidelnou ~ 200% kapacity JIS.

Aktualizovaná záťaž v nemocnici na základe potvrdených prípadov do 21. marca

Podarilo sa mi odhadnúť nemocničné lôžka pre štáty v USA pomocou údajov odtiaľto. Ako môžete vidieť na grafe, potvrdené prípady v San Maríne už prekročili počet nemocničných postelí. Nemocničné zaťaženie v Taliansku sa zvýšilo na ~ 23%. Tri štáty v USA, New Yorku, Washingtone a New Jersey sa tiež umiestnili v top 20, pričom 16%, 12% a 4% všetky nemocničné postele sú potenciálne obsadené potvrdenými prípadmi COVID-19, za predpokladu, že všetky vyžadujú hospitalizáciu.

kódy:

https://github.com/wangz10/covid_19_analyses