Gestire meglio i codici di patologia con l’intelligenza artificiale

La condivisione delle informazioni mediche è sempre più importante, data l’attitudine a trattare le patologie in team multidisciplinari, ma non solo. Le note mediche sono essenziali anche per facilitare la gestione amministrativa e i rimborsi delle varie prestazioni offerte da ospedali e ambulatori e per l’avanzare della ricerca.

Da tempo i codici sono standardizzati secondo l’International Classification of Diseases (ICD): questi vengono assegnati per lo più manualmente partendo dalla descrizione della nota clinica, oppure utilizzando dei sistemi automatici. È importante che i codici siano assegnati in modo corretto per facilitare le procedure successive. Purtroppo, è noto che non sempre i sistemi già in uso sono efficaci e ci si trova spesso davanti a una serie di prestazioni codificate come unspecified type, chiamate code. L’ideale sarebbe ridurre queste code.

Allo stesso tempo, se si osserva con grande attenzione, ci si accorge che tanti dei sistemi noti sfruttano alcuni codici più di altri, il che rischia di far perdere la visione di insieme sulla complessità dei diversi interventi. Per ovviare a questa situazione, un team di ricerca della School of Information Science and Technology della Dalian Maritime University, in Cina, ha sviluppato un modello di apprendimento congiunto utile per assegnare a ogni visita, trattamento o indagine diagnostica il corretto ICD in automatico, basandosi su quanto scritto nella nota clinica.

Il sistema è basato sull’intelligenza artificiale e ha tre punti di forza:

  • il sistema fa la codifica degli ICD sfruttando un modello a doppia attenzione; il testo medico da analizzare, infatti, viene valutato sia con un meccanismo di label-attention sia con uno di self-attention. Questo doppio controllo dovrebbe ridurre gli errori di codifica. Questo sistema predittivo può essere ulteriormente migliorato
  • il sistema è stato pensato per gestire lunghe code di prestazioni
  • gli autori hanno introdotto un meccanismo per ridurre il rumore di fondo, ovvero il disturbo al processo decisionale dell’ICD, per velocizzare il modello di convergenza.

Una volta sviluppato, questo sistema è stato testato sul dataset MIMIC-III e messo a confronto con altri modelli, in particolare il SOTA.
I risultati sono interessanti: il nuovo sistema sembra essere più preciso e riuscire a valutare meglio le varie metriche. Gli autori riconoscono certamente i limiti del loro studio, in particolare la dimensione del dataset utilizzato per la validazione: saranno necessari studi successivi per confermare la bontà di questo modello.

Gli autori, inoltre, si dicono decisi a migliorarlo ulteriormente. Lo studio pone in ogni caso l’attenzione sull’importanza di assegnare i corretti ICD alle varie azioni sanitarie: ciò può influenzare positivamente molti aspetti del mondo medico, compresa la ricerca, perché permette, per esempio, di dividere un database in vari gruppi in base all’ICD stesso.

(Lo studio: Li, X., Zhang, Y., Islam, F.u. et al. JLAN: medical code prediction via joint learning attention networks and denoising mechanism. BMC Bioinformatics 22, 590 (2021). https://doi.org/10.1186/s12859-021-04520-x)

Stefania Somaré