Cosa vuol dire predittività

Dite la verità, quante volte avete sentito o letto la frase «questi test non sono predittivi»? Ebbene, quando qualcuno afferma che un test usato in ambito biosanitario, o addirittura un’intero gruppo di test , non è predittivo, vi siete mai chiesti cosa stia dicendo in realtà? Vi siete mai chiesti cosa significa predittività?

Ebbene, vi svelo un segreto una frase del genere, espressa in questi termini non significa assolutamente niente.

Stupiti? Mi spiego.

Innanzitutto una piccola premessa. Di solito nei miei post cerco di ridurre il più possibile l’uso del lessico specialistico e della matematica, perché mi rendo conto che non tutti li digeriscono facilmente. Stavolta purtroppo non sarà possibile e un po’ di matematica dovrò usarla per forza, ma non vi preoccupate, è poca ed è piuttosto facile.

Cominciamo dal principio. Il termine predittività fa riferimento ad una particolare categoria di test usati in ambito biosanitario, i test diagnostici. Un test diagnostico è un test utilizzato per verificare la presenza di una malattia o di qualunque altra caratteristica di interesse in un soggetto, per esempio un fattore di rischio. Ce ne sono migliaia diversi, ciascuno con caratteristiche proprie.Una caratteristica dei test diagnostici è quella di avere solo due risposte possibili, positivo o negativo. Non sono test usati per “misurare” qualcosa (anche se ogni tanto la risposta dipende da una misura) ma per fornire una risposta di tipo sì/no.

In un mondo perfetto un test diagnostico è accurato al 100%, non esistono cioè casi in cui la malattia è presente e il test è negativo (falsi negativi) né casi in cui la malattia è assente ma il test è positivo (falsi positivi). Purtroppo nella realtà questo non avviene mai, tutti i test hanno una certa percentuale di falsi positivi e di falsi negativi.

È molto importante per chi somministra un test sapere esattamente quali sono i limiti del test che sta somministrando, ed è possibile conoscerli tramite appositi strumenti statistici.

Ogni test possiede quattro valori che lo caratterizzano e ne descrivono la performance: la sensibilità, la specificità, la predittività positiva e la predittività negativa. Ciascuno di questi valori vuol dire poco in assenza degli altri. In particolare gli ultimi due non si possono ottenere senza i primi due.

Poniamo ora di avere un test diagnostico per una qualche malattia. Chiamiamo D + i soggetti malati e D i soggetti sani. D+ + D sarà tutta la popolazione (malati + sani), mentre D+/(D+ + D) sarà la probabilità di avere la malattia, scrivendolo matematicamente P(D+). Questo valore è chiamato prevalenza, e se lo moltiplichiamo per 100 otteniamo la percentuale della popolazione che è malata in quel momento. Per esempio uno studio riferisce che la P(D+) del cancro alla cervice uterina è 0.000083, quindi lo 0.0083% delle donne esaminate ha il cancro alla cervice uterina.

Dobbiamo ora sperimentare il nostro test. Durante la fase di sperimentazione clinica somministreremo il test a persone che sicuramente hanno la malattia, e vedremo se e quando il test risulterà effettivamente positivo. Vedremo quindi qual è la frazione di soggetti malati il cui test risulta effettivamente positivo. Se chiamiamo T+ i test positivi e T i test negativi, il valore che stiamo cercando sarà P(T+ | D+). Quella sbarra verticale nel mezzo si legge “condizionato”. La probabilità condizionata si applica quando abbiamo un evento già verificato e vogliamo conoscere la probabilità di un secondo evento che ne viene influenzato. In questo caso vogliamo sapere la probabilità di avere un test positivo (T+) per un soggetto che sappiamo già essere malato (D+). Questo valore è la sensibilità del test.

Per esempio da uno studio risulta che per il Pap test, un test utilizzato negli screening per il cancro alla cervice uterina, P(T+ | D+) = 0.8375, quindi l’83.75% dei malati ha un test positivo.

Adesso farò esattamente il contrario di quello che ho fatto prima farò il test a dei soggetti sicuramente sani, e verificherò quanti avranno un test negativo. Applicando la stessa notazione di prima e chiamando T i test negativi scriverò P(T | D). Questo valore è la specificità del test. Proseguendo con l’esempio del Pap test, la sua specificità è 0.8136.

Immaginiamo ora di aver completato la fase sperimentale per il nostro test. Ora il nostro test verrà utilizzato in situazioni reali per diagnosticare una malattia a persone che non sanno di averla, o quantomeno per farle sottoporre ad ulteriori accertamenti. Ma come si comporterà il nostro test nella vita reale? Durante la sperimentazione sapevamo già in anticipo quali erano i sani e quali i malati, nella realtà quando useremo il test non sapremo mai a priori se la persona che abbiamo di fronte è sana o malata. L’unica cosa che avremo di certo sarà il risultato del test.

Vogliamo quindi sapere quanto sbaglierà il nostro test. In pratica avremo una persona con un test positivo (T+) e vogliamo sapere qual è la probabilità che abbia davvero la malattia. Questo è esattamente il contrario di quello che avevamo fatto prima, e infatti si scrive P(D+ | T+). Questo valore è la predittività positiva del test.

E qui viene il difficile. A meno di non usare “alla cieca” il test per un po’, non abbiamo la possibilità di misurare sperimentalmente questo valore. Fortunatamente la statistica ci viene in aiuto. Infatti coi valori che abbiamo già ottenuto possiamo calcolare la predittività positiva grazie al teorema di Bayes. Applicandolo alla nostra situazione si avrà

Teorema di Bayes

Non ci spaventiamo, se guardiamo attentamente vedremo che i fattori presenti nell’espressione qui sopra li abbiamo già quasi tutti. Ci manca P(T+ | D), ma siccome è il complementare di P(T | D) e ogni probabilità è un numero compreso tra 0 e 1, il valore che ci manca sarà uguale a 1 – P(T | D).

Allo stesso modo P(D) sarà uguale a 1 – P(D+).

Se facciamo i calcoli con i valori che già abbiamo per il il Pap test otteniamo che la sua predittività positiva P(D+ | T+) = 0.000373. In pratica su un milione di donne positive al test 373 hanno il cancro. Sembra un valore un po’ bassino? Un attimo di pazienza, ora ci arriviamo.

C’è un ultima cosa che ci rimane da calcolare, ugualmente importante. Vogliamo infatti sapere qual è la probabilità che una persona con un test negativo sia effettivamente sana. A questo punto dovreste essere in grado di scriverlo da soli: P(D– | T). E ancora una volta dovremo applicare il teorema di Bayes:

Teorema di Bayes

Anche stavolta, esattamente come prima, abbiamo già tutto quello che ci serve per fare i conti. Nel caso del Pap test otteniamo che la predittività negativa P(D– | T) = 0.999983. Cioè su un milione di donne negative al test 999983 saranno effettivamente sane.

Proviamo a trarre qualche considerazione finale da tutto questo. Innanzitutto abbiamo visto una cosa importante: non si può parlare genericamente di “predittività”, perché non significa niente. Bisogna parlare di predittività positiva e predittività negativa. Un’altra cosa che abbiamo visto è che i valori di predittività non saltano fuori dal nulla, vanno ricavati dalla sensibilità e dalla specificità. Quindi parlare di predittività senza conoscere questi due valori, oltre alla prevalenza, è sostanzialmente impossibile. Terza considerazione, non si può dire genericamente che un test è o non è predittivo. La predittività positiva e la predittività negativa di un test sono due bei numeri, di solito con tante belle cifre dopo la virgola, e sì, senza quei numeri “predittività” non significa niente.

Il valore predittivo va poi associato al contesto e agli scopi del test. Vi ricordate la predittività positiva per il Pap test? Quello 0.000373 che ci sembrava tanto basso? In realtà nel caso in questione va più che bene. È così basso perché il Pap test in realtà rileva non il cancro, ma il papilloma virus, che ne è la causa. Ci va bene una predittività positiva così bassa perché le donne positive al Pap test si sottoporranno ad ulteriori e più frequenti controlli, comprese quelle che il cancro lo hanno davvero, che quindi lo scopriranno in fase precoce e avranno molte più possibilità di cavarsela.

In questo caso infatti è molto più importante avere un alto valore di predittività negativa. Per il Pap test la predittività negativa è molto alta (99.9983%), il che ci garantisce che quelle rimandate a casa con un test negativo siano effettivamente per la quasi totalità sane (purtroppo un minimo di errore rimane sempre). Quindi, pur dando un test positivo a molte donne sane, saremo sicuri di aver “preso” anche tutte quelle malate.

Il Pap test è un esempio, per test diversi in diversi contesti avremo bisogno di valori diversi. E questo mi porta all’ultima considerazione, e cioè che se affermi che la predittività (positiva o negativa) di un test è troppo bassa, devi essere in grado di giustificare questa affermazione in relazione al tipo di test e ai suoi scopi.

Quindi la prossima volta che qualcuno vi dirà che un test non è predittivo chiedetegli:

  1. a quale test si riferisce;
  2. quali sono la sensibilità e la specificità di quel test;
  3. quali i sono valori predittivi positivo e negativo di quel test;
  4. perché ritiene che siano troppo bassi per gli scopi del test.

Se il vostro interlocutore non è in grado di rispondere a queste domande o non sa di cosa parla o è in malafede. In ogni caso non dategli ascolto.

 

BIBLIOGRAFIA

Devesa SS, Silverman DT, Young JL Jr, Pollack ES, Brown CC, Horm JW, Percy CL, Myers MH, McKay FW, Fraumeni JF Jr. Cancer incidence and mortality trends among whites in the United States, 1947-84. J Natl Cancer Inst. 1987 Oct;79(4):701-70.

Fahey MT, Irwig L, Macaskill P. Meta-analysis of Pap test accuracy. Am J Epidemiol. 1995 Apr 1;141(7):680-9.

DeLong ER, Vernon WB, Bollinger RR. Sensitivity and specificity of a monitoring test. Biometrics. 1985 Dec;41(4):947-58.

Attenzione, i valori riportati in questo articolo fanno riferimento ad una ben precisa area geografica e ad un ben preciso periodo di tempo. Non sono validi ovunque e sempre.

Annunci