Dobbiamo imparare a gestire le incertezze in statistica

Vogliamo certezze in tempi incerti. Tuttavia, le statistiche non possono sempre fornircela. Tanja Stadler utilizza la stima del valore R calcolato per la Svizzera per spiegare perché dobbiamo tenere conto anche dell'incertezza statistica.

Tanja Stadler

Il numero di infezioni da Covid sta attualmente aumentando in modo esponenziale in Svizzera o sta diminuendo? E quanto velocemente si stanno diffondendo le nuove varianti del virus rispetto a quelle vecchie? Cerchiamo di rispondere a queste domande analizzando i dati statistici. Noi scienziati vorremmo fornire risposte molto chiare e prive di ambiguità. A volte è possibile, ma non sempre. Perché quando si tratta della nostra vita nel mondo reale e delle malattie, praticamente nulla ha un tempo preciso.

In qualsiasi ambito della vita ci troviamo, abbiamo sempre a che fare con fluttuazioni e variazioni. Il nostro viaggio verso il lavoro non dura sempre esattamente lo stesso tempo, ma possiamo comunque stimare approssimativamente la durata del viaggio. Oppure un bambino di 7 anni dovrebbe essere alto 1,25 metri secondo la tabella. Tuttavia, qualsiasi altro valore compreso tra 1,15 e 1,35 metri è perfettamente accettabile.

"Un singolo stimatore non è sufficiente per avere un quadro completo della situazione epidemiologica".Tanja Stadler

La pandemia non fa eccezione. Se una persona infetta da Sars-CoV-2 infetta in media un'altra persona, ciò significa che in realtà alcune persone infette infetteranno diverse altre persone, mentre altre non infetteranno nessuno. Un altro esempio è il periodo di incubazione, ovvero il tempo che intercorre tra l'infezione del virus e la comparsa dei primi sintomi. In media è di cinque giorni. In realtà, può essere di tre giorni per alcuni pazienti e di sette o otto per altri. Oppure il numero di nuove infezioni, che è una delle basi principali delle nostre analisi: anche questo oscilla di giorno in giorno.

Le stime statistiche hanno sempre un intervallo di incertezza. (Immagine: ETH di Zurigo)
Le stime statistiche hanno sempre un intervallo di incertezza. (Immagine: ETH di Zurigo)

L'intervallo di incertezza è fondamentale

Nel mio gruppo, calcoliamo le stime del valore R della pandemia di corona.1. Se questo valore è maggiore di 1, l'agente patogeno si diffonde in modo esponenziale in una popolazione. Le nostre stime tengono conto di queste e altre fluttuazioni. Una conseguenza di ciò, tuttavia, è che le nostre stime non forniscono mai un valore preciso, ma sempre un intervallo di stime.

Per esempio, possiamo dire che il valore R stimato per la Svizzera è attualmente compreso tra 0,96 e 1,21. Questa affermazione è statisticamente affidabile. Chiamiamo l'intervallo corrispondente l'intervallo di incertezza. Inoltre, comunichiamo un valore che si trova al centro di questo intervallo. Si tratta della migliore stima per un singolo valore, che chiamiamo stima puntuale. Tuttavia, la stima puntuale non deve essere sovrainterpretata.

Affermazione "assicurata" e tendenze

Se l'intervallo di incertezza per il valore R non è completamente inferiore a 1 o superiore a 1, possiamo interpretare i dati e parlare di una tendenza. Tuttavia, non possiamo dire con significatività statistica se siamo in una fase di crescita esponenziale. Ciò significa che non possiamo fare un'affermazione "affidabile".

Le fluttuazioni sono tanto più concise quanto minore è la quantità di dati analizzati. Questo perché con una grande quantità di dati, le fluttuazioni esistenti si annullano a vicenda. Meno dati possiamo analizzare, maggiore è l'intervallo di incertezza. Lo vediamo, ad esempio, nei dati dei piccoli cantoni. I dati raccolti in questi cantoni sono troppo pochi per poter fare affermazioni statisticamente fondate. Gli intervalli di incertezza nelle nostre analisi per i cantoni più piccoli sono molto ampi.

Intervalli di incertezza
Nei cantoni più piccoli (Nidvaldo a sinistra), l'intervallo di incertezza è molto più ampio rispetto ai cantoni più grandi (Zurigo a destra). (Fonte: https://tb.ethz.ch/plot.html)

Credo quindi che sia più opportuno concentrarsi sulle sette aree economiche (grandi regioni). Le persone si spostano molto all'interno di queste regioni. Se osserviamo queste regioni, possiamo riconoscere le tendenze. La stima puntuale di R è attualmente superiore a 1 in tutte e sette le principali regioni svizzere. Anche se non possiamo fare un'affermazione conclusiva sul valore stimato di R, possiamo comunque interpretare questi dati. Le stime puntuali in tutte le regioni forniscono una forte indicazione del fatto che attualmente - purtroppo - ci troviamo in un'area di crescita esponenziale in Svizzera.

Dati sulle principali regioni
La stima puntuale più recente (stella) è superiore a 1 in tutte e sette le principali regioni svizzere (fonte: https://ibz-shiny.ethz.ch/covid-19-re-international/)

La stima del valore R da sola non è sufficiente

La stima del valore R può fornire un'indicazione della direzione in cui potrebbe svilupparsi la pandemia. Tuttavia, dobbiamo sempre tenere conto dell'intervallo di incertezza e interpretare i dati con cautela. È inoltre necessario confrontare sempre la stima del valore R con altri parametri della pandemia, poiché un singolo stimatore non è sufficiente per ottenere un quadro completo della situazione epidemiologica.

Tutti vorremmo avere certezze in questi tempi incerti. Tuttavia, le statistiche non possono sempre fornircela. Non c'è modo di eliminare l'incertezza. È una conseguenza diretta del fatto che abbiamo a che fare con processi nel mondo reale. Dobbiamo quindi accettare l'incertezza e trovare un modo per affrontarla come società. Nel nostro team, ci proponiamo di riconoscere le dinamiche basate sui dati disponibili, identificare i possibili scenari e quantificarli con le probabilità. Il modo in cui reagiremo insieme a tutto questo è una decisione che spetta ai politici e alla società.

Supplemento del 15.03.2021:
La stima del valore R della Svizzera viene aggiornata costantemente. Attualmente la stima varia da 1,00 a 1,26.

JavaScript è stato disabilitato nel browser