Gli esseri umani superano l’intelligenza artificiale nell’interpretazione delle radiografie del torace

Umani migliori di intelligenza artificiale nelle radiografie del torace

Gli strumenti di intelligenza artificiale possono aiutare a aumentare la fiducia dei radiologi nelle loro diagnosi, ma non possono essere considerati affidabili per identificare le malattie polmonari comuni nelle radiografie del torace, secondo uno nuovo studio.

I ricercatori hanno messo 72 radiologi a confronto con quattro strumenti di intelligenza artificiale commerciali in un’analisi di oltre 2.000 radiografie del torace. Gli esperti umani hanno vinto, secondo i risultati pubblicati il 25 settembre su Radiology.

“La radiografia del torace è uno strumento diagnostico comune, ma è necessaria una formazione e un’esperienza significative per interpretare correttamente gli esami”, ha detto il ricercatore principale, il dott. Louis Plesner, radiologo residente e dottorando in radiologia presso l’Ospedale di Herlev e Gentofte di Copenaghen, Danimarca.

“Sebbene gli strumenti di intelligenza artificiale siano sempre più approvati per l’uso nei reparti radiologici, c’è una necessità non soddisfatta di testarli ulteriormente in scenari clinici reali”, ha dichiarato Plesner in un comunicato stampa della rivista. “Gli strumenti di intelligenza artificiale possono aiutare i radiologi nell’interpretazione delle radiografie del torace, ma la loro accuratezza diagnostica nella vita reale rimane incerta”.

Gli strumenti di intelligenza artificiale commercialmente disponibili e approvati dalla FDA sono disponibili per assistere i radiologi, ha detto Plesner.

In questo studio, le radiografie del torace erano state effettuate in due anni presso quattro ospedali danesi. Circa un terzo aveva almeno una diagnosi target.

Le radiografie del torace sono state esaminate per tre risultati comuni: malattia degli spazi aerei, che è un modello di radiografia del torace, ad esempio, causato da polmonite o edema polmonare; pneumotorace, o polmone collassato; ed effusione pleurica, un accumulo di liquido intorno ai polmoni.

Gli strumenti di intelligenza artificiale avevano tassi di sensibilità compresi tra il 72% e il 91% per la malattia degli spazi aerei, dal 63% al 90% per il pneumotorace e dal 62% al 95% per l’effusione pleurica. Un test altamente sensibile significa che vengono persi meno casi di malattia.

Lo studio ha dimostrato che i radiologi hanno superato gli strumenti di intelligenza artificiale nell’identificazione accurata della presenza e dell’assenza delle tre comuni malattie polmonari.

“Gli strumenti di intelligenza artificiale hanno mostrato una sensibilità moderata a elevata, paragonabile a quella dei radiologi, nel rilevare la malattia degli spazi aerei, il pneumotorace e l’effusione pleurica nelle radiografie del torace”, ha detto Plesner. “Tuttavia, hanno prodotto più risultati falsi positivi [prevedendo una malattia quando non era presente] rispetto ai radiologi e le loro prestazioni sono diminuite quando erano presenti più risultati e per bersagli più piccoli”.

Per il pneumotorace, la probabilità che i pazienti con un risultato positivo allo screening avessero effettivamente la malattia variava dal 56% all’86% per i sistemi di intelligenza artificiale rispetto al 96% per i radiologi.

“Gli strumenti di intelligenza artificiale si sono comportati peggio nell’identificare la malattia degli spazi aerei, con valori predittivi positivi compresi tra il 40% e il 50%”, ha detto Plesner. “In questo campione di pazienti difficili e anziani, l’intelligenza artificiale ha previsto la malattia degli spazi aerei quando non era presente cinque o sei volte su 10. Non puoi avere un sistema di intelligenza artificiale che lavora da solo a quel tasso”.

Lo scopo dei radiologi è bilanciare sia la ricerca che l’esclusione della malattia, evitando importanti malattie trascurate e sovradiagnosi, ha detto Plesner.

“I sistemi di intelligenza artificiale sembrano molto bravi a trovare la malattia, ma non sono altrettanto bravi come i radiologi nell’identificare l’assenza di malattia, specialmente quando le radiografie del torace sono complesse”, ha detto. “Troppe diagnosi di falsi positivi comporterebbero immagini inutili, esposizione alle radiazioni e costi aumentati”.

Negli studi precedenti che sostenevano la superiorità dell’intelligenza artificiale rispetto ai radiologi, i radiologi hanno esaminato solo l’immagine senza avere accesso alla storia clinica del paziente e agli studi di imaging precedenti. “Nella pratica quotidiana, l’interpretazione di un esame di imaging da parte di un radiologo è una sintesi di questi tre punti di dati”, ha detto Plesner.

Ulteriori informazioni

L’American Hospital Association ha ulteriori informazioni sull’utilizzo dell’intelligenza artificiale nella diagnosi e nella cura.

FONTE: Radiology, comunicato stampa, 26 settembre 2023

SLIDESHOW