S. De Iaco – Università del Salento
S. Maggio – Università del Salento
G. Giungato – Università del Salento
M. Palma – Università del Salento
D. Pellegrino – Università del Salento
D. Posa – Università del Salento
L’emergenza sanitaria provocata dall’evoluzione dei contagi da COVID-19 (acronimo di COronaVIrus Disease 19), in rapida e continua crescita in tutto il mondo, richiede una dettagliata disamina dei dati. Il presente lavoro si propone un confronto tra i differenti scenari che nel panorama mondiale hanno delineato la curva del contagio fino allo stato attuale. In particolare, per il periodo gennaio-marzo 2020, sarà analizzato l’andamento temporale del tasso di prevalenza e del tasso di letalità del COVID-19 e sarà proposto l’adattamento di modelli stocastici a scopi previsionali. Le evidenze empiriche potranno delineare similarità e differenze nelle curve di diffusione dei contagi, consentendo così proiezioni attendibili nel breve termine per i principali paesi coinvolti nell’emergenza pandemica.
1. Introduzione
Numerosi studi sono stati realizzati, al fine di prevedere l’evoluzione della curva dei contagi della pandemia COVID-19, con particolare riferimento alla Cina, dove il virus si è originariamente manifestato (Wang et al., 2020, Huang et al., 2020, Chan et al., 2020). Altri studi riguardano il dato complessivo a livello mondiale (Benvenuto et al., 2020), dove modelli della classe ARIMA (Box et al., 2008) sono stati adattati per descrivere e fornire previsioni per il tasso di incidenza e quello di prevalenza da COVID-19.
In tale contesto emergenziale in continua evoluzione, il presente lavoro si propone una analisi comparativa tra gli scenari che a livello mondiale hanno caratterizzato l’evoluzione del contagio. In particolare, l’adattamento di modelli stocastici all’andamento temporale del tasso di prevalenza[1] e del tasso di letalità[2] del COVID-19, inoltre, ha consentito di ottenere delle proiezioni riguardanti l’immediato futuro nelle Nazioni che maggiormente stanno affrontando l’emergenza pandemica.
2. La diffusione del COVID-19 nel mondo
Il COVID-19 (acronimo di COronaVIrus Disease 19) è una malattia infettiva respiratoria causata dal virus denominato SARS- CoV-2 appartenente alla famiglia dei coronavirus. Il primo focolaio di Covid-19 è stato reso noto ufficialmente dalla Commissione Sanitaria Municipale della città di Wuhan (capoluogo della provincia di Hubei, nella Cina Centrale), il 31 dicembre 2019. Nelle settimane successive, il Covid-19 si è diffuso a livello mondiale e l’11 marzo 2020 il direttore generale dell’Organizzazione Mondiale per la Sanità ha ufficialmente dichiarato lo stato di pandemia.
Secondo i dati pubblicati dall’agenzia dell’Unione Europea ECDC (European Centre for Disease prevention and Control), dal 31 dicembre 2019 al 30 marzo 2020 (CET 17:00) sono stati segnalati, nel mondo, 715660 casi di COVID-19, tra cui 33579 decessi. In particolare, il maggior numero di casi si sono riscontrati nei continenti americano (soprattutto negli Stati Uniti d’America laddove si sono registrati 143025 casi), asiatico (soprattutto in Cina con 82463 casi ed in Iran con 38309 casi) ed europeo (in prevalenza, il numero di casi si è rilevato in Italia con ben 97689 casi, seguita dalla Spagna con 78797, dalla Germania con 57298 casi, dalla Francia con 40174 casi e dal Regno Unito con 19522).
Con riferimento al numero di decessi, l’Italia al 30 marzo 2020 risulta essere tra i paesi più colpiti, con 10781 decessi, seguita dalla Spagna (con 6528 decessi), dalla Cina (con 3311 decessi), dall’Iran (2640 decessi), dalla Francia (2606 decessi), dagli USA (2509 decessi) e dal Regno Unito (1228 decessi).
Al fine di fornire un’analisi comparativa a livello globale, è stata focalizzata l’attenzione su tutti i 196 Paesi del mondo colpiti dal COVID-19. Pertanto, sulla base dei dati della ECDC, aggiornati al 30/03/2020, è stato realizzato il ranking mondiale delle Nazioni per numero di casi totali. In particolare, ci si è soffermati sulle nazioni che occupano le prime 12 posizioni nel suddetto ranking e per le quali vengono riportati in Tab. 1 il numero di casi totali, il numero di decessi totali ed alcuni indicatori.
Dai dati riportati in Tab. 1 si evince che USA, Italia e Cina risultano, nell’ordine, le prime nazioni in graduatoria. Inoltre, è opportuno precisare che se si considera il ranking mondiale per numero di decessi totali, le Nazioni che occupano le prime 12 posizioni sono le stesse, anche se in alcuni casi con posizioni diverse rispetto a quelle occupate nel ranking per numero di casi totali. In particolare, Italia, Spagna e Cina, nell’ordine, risultano essere i paesi con numero di decessi più elevato, mentre gli USA scendono in sesta posizione.
Per le 12 nazioni considerate, sono stati riportati in Tab. 1 anche alcuni interessanti indicatori relativi alla pandemia, quali il tasso di prevalenza, il tasso di letalità, nonché il tasso di mortalità. Con riferimento al tasso di prevalenza si può notare che, mentre da un lato, la Cina presenta il valore più basso tra le nazioni considerate, dall’altro, Spagna, Svizzera e Italia, nell’ordine, registrano i valori più elevati. Infine, mentre Italia, Spagna e Olanda rappresentano, nell’ordine, le nazioni con i valori più elevati sia per il tasso di letalità che per il tasso di mortalità, Germania e Cina, rispettivamente, presentano i valori più bassi di tali indicatori tra le nazioni considerate.
3. L’evoluzione temporale delle curve di contagio
Lo studio dell’evoluzione temporale del Coronavirus nelle nazioni in cui si è registrato il maggior numero di casi può rappresentare uno strumento utile ad evidenziare le priorità, monitorare gli effetti degli interventi attuati dai rispettivi governi, nonché per pianificare nuove azioni di contenimento.
In particolare, nel periodo 01/01/2020–30/03/2020, tra le prime dieci nazioni in cui si è registrato il maggior numero di casi di contagi da COVID-19 vi sono: USA, Italia, Cina, Spagna, Germania, Francia e Regno Unito.
Per quanto concerne il paese cinese, la situazione esplode il 9/01/2020, giorno in cui, per il tasso di incidenza, si registra la variazione relativa percentuale di segno positivo più elevata (+7,0%). Dall’analisi della serie storica giornaliera del tasso di incidenza di tale virus (Fig. 1), emerge che, rispetto alle altre nazioni analizzate, la Cina ha registrato un numero più elevato di nuovi casi nel periodo dal 25/01/2020 al 13/02/2020, data in cui si osserva il valore massimo del tasso di incidenza (1,09 casi in media al giorno, ogni 100.000 abitanti).
A partire da tale giorno, la serie storica inverte la sua tendenza ed inizia a decrescere costantemente. In particolare, il 23/02/2020, quando il virus inizia a diffondersi in Italia (tasso di variazione percentuale italiano pari a +3,4%), il tasso di incidenza di COVID-19 in questa nazione supera quello cinese (0,10 nuovi casi in media al giorno, ogni 100.000 abitanti). La serie storica del tasso di incidenza calcolato per il paese italiano assume valori più elevati rispetto alle altre nazioni analizzate fino al 22/03/2020, giorno in cui si registra il valore massimo (10,9 nuovi casi in media al giorno, ogni 100.000 abitanti).
Inoltre, proprio da questo istante, la situazione epidemiologica esplode nella nazione spagnola: il tasso di incidenza del Coronavirus, infatti, si attesta su livelli più elevati rispetto alle altre nazioni analizzate, con un picco rilevato il 27/03/2020 (18,4 nuovi casi in media al giorno, ogni 100.000 abitanti).
Per quanto concerne le altre nazioni, è interessante osservare come il virus si diffonda con ritardo. In particolare, in Germania e nel Regno Unito, il numero più elevato di nuovi casi si rileva il 28/03/2020 (7,6 e 4,3 ogni 100.000 abitanti, rispettivamente), in Francia e negli USA il giorno successivo (6,9 e 6,1 nuovi casi in media al giorno ogni 100.000 abitanti).
Dall’analisi dell’evoluzione temporale della serie storica del tasso di prevalenza (Fig. 2), è interessante osservare che in Cina la proporzione della popolazione contagiata dal COVID-19 è in media pari a 3 casi al giorno ogni 100.000 abitanti ed è più elevata rispetto a quanto registrato per le altre nazioni analizzate, fino al 06/03/2020. In tale giorno, infatti, il tasso di prevalenza italiano supera quello cinese (6,4 casi in media al giorno ogni 100.000 abitanti). Per la nazione italiana, mediamente, la proporzione di casi complessivamente contagiati dal Coronavirus è di 18,3 ogni 100.000 abitanti con un valore massimo pari a 161,7 casi osservato il 30/03/2020.
Per le restanti nazioni, il tasso di prevalenza supera quello cinese a partire dalla metà del mese di marzo, ma si attesta su valori medi inferiori a quello italiano, ad eccezione della Spagna che, in media, ha una proporzione di contagiati pari a 12,8 ogni 100.000 abitanti. In particolare, il tasso di prevalenza supera quello italiano il 30/03/2020, quando si registrano 168,6 casi complessivi ogni 100.000 abitanti.
L’effetto devastante della diffusione del Coronavirus nelle nazioni analizzate emerge anche osservando la serie storica del tasso di mortalità (Fig. 3). In particolare, in termini di tasso di mortalità, è lo stato italiano che registra i valori più elevati, soprattutto a partire dal mese di marzo 2020. Da tale istante, infatti, la curva inizia a crescere in maniera esponenziale, fino a raggiungere il valore massimo il 28/03/2020 (mediamente 1,6 decessi al giorno ogni 100.000 abitanti). Neanche la Cina, nel giorno in cui registra il picco massimo del tasso di mortalità raggiunge tale valore, ma si ferma a 0,02 decessi ogni 100.000 abitanti (13/02/2020).
Per quanto concerne le altre nazioni, è interessante osservare che solo per la Spagna si osservano valori del tasso di mortalità comparabili con quelli italiani ed addirittura raggiunge il livello italiano il 24/03/2020 e continua a crescere, con tassi di mortalità più elevati di quelli italiani: infatti, il valore massimo, pari a 1,8 decessi ogni 100.000 abitanti, è stato registrato il 30/03/2020.
Infine, in tale contesto è interessante analizzare la letalità del COVID-19 nelle nazioni in cui il fenomeno si è maggiormente diffuso.
In particolare, dall’analisi dell’evoluzione temporale della serie storica del tasso di letalità (Fig. 4) emerge che, sul totale dei soggetti contagiati, la proporzione maggiore di decessi si registra in Italia, Francia ed USA, seppur in istanti temporali differenti.
Così come per le altre curve di contagio, nella prima parte del periodo analizzato, i tassi di letalità più elevati si registrano in Cina, fino al 15/02/2020, giorno in cui il livello di letalità del Coronavirus in Francia, registra valori significativi (0,10 decessi per ogni contagio), fino a raggiungere il picco massimo il 27/02/2020 (0,12 decessi per ciascun contagio). Tuttavia, da tale istante, la curva della letalità francese inizia a decrescere, fino ai primi giorni del mese di marzo, in cui inverte nuovamente la tendenza ed inizia a crescere.
Lo stesso comportamento si osserva per il tasso di letalità degli USA: a partire dal picco massimo registrato il 04/03/2020 (0,07 decessi per ogni contagio) il livello di letalità inizia a decrescere velocemente, per poi riprendere la crescita dal 20/03/2020, seppur più lentamente rispetto alla nazione francese.
Differente appare, invece, la situazione in Italia, in cui il livello di letalità del COVID-19 cresce velocemente a partire dal 23/02/2020, giorno in cui si registra anche un incremento, e non si assesta mai: infatti, il picco massimo si osserva il 30/03/2020 (0,07 decessi per ogni contagio).
Infine, anche in Spagna e nel Regno Unito la situazione appare critica: anche se i livelli di letalità sono più bassi rispetto a quelli di Francia, Italia ed USA, la curva cresce costantemente a partire dal 6/03/2020.
4. Previsioni
I modelli adattati sono della classe ARIMA (media mobile integrata autoregressiva). E’ stato utilizzato il test Augmented Dickey-Fuller (ADF) a radice unitaria per verificare se le serie storiche sono stazionarie. Nel caso specifico, la non-stazionarietà è stata trattata mediante le differenze successive di ordine 2.
I parametri del modello ARIMA sono stati stimati dal grafico della funzione di autocorrelazione (ACF) e dal correlogramma di autocorrelazione parziale (PACF). Per determinare il tasso di prevalenza di COVID-19, ARIMA (2,2,2) è stato selezionato come miglior modello ARIMA, mentre ARIMA (3,1,1) è stato selezionato come miglior modello ARIMA per determinare il tasso di letalità da COVID-19. Tali modelli sono stati utilizzati per effettuare previsioni dei suddetti indicatori nei 3 giorni successivi all’ultimo giorno osservato, ovvero 31 marzo e 1-2 aprile 2020, in Italia, Spagna, USA e Germania (Fig. 5).
Le elaborazioni sono state eseguite con il software statistico Gretl.
Sebbene siano necessari più dati per poter effettuare previsioni più attendibili, si stima che sia in termini di tasso di prevalenza che di tasso di letalità, la diffusione del virus in Italia, Spagna e Germania, crescerà nei primi giorni del mese di aprile, a ritmi pressoché simili rispetto a quelli registrati, per i due indicatori, negli ultimi giorni di marzo. D’altra parte, negli USA pur continuando a registrarsi nei primi giorni di aprile una crescita lineare del numero totale dei casi ogni 100000 abitanti, si prevede tuttavia che il tasso di letalità da COVID-2019 resti costante (intorno al valore 0,017).
E’ auspicabile che se il virus non sviluppa nuove mutazioni, il numero di casi dovrebbe raggiungere un plateau.
[1] Il tasso di prevalenza è la proporzione della popolazione affetta da una malattia o da una condizione particolare in un determinato momento nel tempo e corrisponde approssimativamente al tasso di incidenza, ponderato per la durata della malattia. Il tasso di incidenza misura il tasso con cui nuovi casi si manifestano in una popolazione.
[2] Il tasso di letalità è una misura di incidenza cumulativa (utilizzata in epidemiologia), che indica la proporzione percentuale di decessi per una determinata malattia sul totale dei soggetti ammalati in un determinato arco temporale.
Riferimenti bibliografici:
- Benvenuto D, Giovanetti M, Vassallo L, Angeletti, S, Ciccozzi, M, 2020, Application of the ARIMA model on the COVID- 2019 epidemic dataset, Data in brief, 29, 105340.
- Box GEP, Jenkins GM, Reinsel GC, 2008, Time Series Analysis: Forecasting and Control, John Wiley & Sons Inc; 4 edizione.
- Chan JFW, Kok KH, Zhu Z, Chu H, To KKW, Yuan S, Yuen KY, 2020, Genomic characterization of the 2019 novel human-pathogenic coronavirus isolated from a patient with atypical pneumonia after visiting Wuhan, Emerg Microbes Infect. 2020, 9(1): 221–236.
- Huang C, Wang Y, Li X, Ren L, Zhao G, Hu Y, Zhang L, Fan G, Xu J, Gu X, Cheng Z, Yu T, Xia J, Wei Y, Wu W, Xie X, Yin W, Li H, Liu M, Xiao Y, Gao H, Guo L, Xie J, Wang G, Jiang R, Gao Z, Jin Q, Wang J, Cao B, 2020, Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China, Lancet, 395(10223):497-506.
- Wang C, Hornby PW, Hayden FG, Gao GF, 2020, A novel coronavirus outbreak of global health concern, Lancet, 395(10223):470-473.