Una seconda macchina kernel per il data mining clinico per informare il processo decisionale medico

Rapporti scientifici volume 13, numero articolo: 10459 (2023) Citare questo articolo

432 accessi

6 Altmetrico

Dettagli sulle metriche

Il processo decisionale medico assistito dall’apprendimento automatico presenta tre sfide principali: raggiungere la parsimonia dei modelli, garantire previsioni credibili e fornire raccomandazioni in tempo reale con elevata efficienza computazionale. In questo articolo formuliamo il processo decisionale medico come un problema di classificazione e sviluppiamo una moment kernel machine (MKM) per affrontare queste sfide. L'idea principale del nostro approccio è quella di trattare i dati clinici di ciascun paziente come una distribuzione di probabilità e sfruttare le rappresentazioni dei momenti di queste distribuzioni per costruire il MKM, che trasforma i dati clinici ad alta dimensionalità in rappresentazioni a bassa dimensionalità pur conservando le informazioni essenziali. Applichiamo quindi questa macchina a vari set di dati clinici pre-chirurgici per prevedere i risultati chirurgici e informare il processo decisionale medico, che richiede una potenza computazionale e tempo per la classificazione significativamente inferiori, ottenendo prestazioni favorevoli rispetto ai metodi esistenti. Inoltre, utilizziamo set di dati sintetici per dimostrare che il quadro di data mining basato sul momento sviluppato è robusto rispetto al rumore e ai dati mancanti e raggiunge la parsimonia del modello fornendo un modo efficiente per generare previsioni soddisfacenti per aiutare il processo decisionale medico personalizzato.

La chirurgia, come intervento medico importante, viene solitamente presa in considerazione quando altri trattamenti danno risultati insoddisfacenti. La previsione degli eventi avversi successivi all'intervento chirurgico sulla base dei dati clinici preoperatori dei pazienti, come i dati della cartella clinica elettronica (EHR), è di fondamentale importanza per informare sia i medici che i pazienti per il processo decisionale1,2. Negli ultimi anni, la maggiore disponibilità di dati clinici e potenza di calcolo ha fortemente stimolato lo sviluppo di tecniche di machine learning (ML) per estrarre informazioni dai dati clinici. In particolare, gli algoritmi ML hanno fatto passi da gigante nelle procedure mediche assistite dall'intelligenza artificiale per la previsione preoperatoria degli esiti postoperatori tramite EHR3,4. Il problema generale del ML si concentra sulla ricerca di una funzione appropriata f che mappa ciascun punto dati di input \({\textbf{X}}\) sull'output desiderato \({\textbf{y}}\), ovvero,

Questo compito è particolarmente impegnativo per i set di dati contenenti cartelle cliniche di grandi dimensioni e tipi di dati misti, tra cui diagnosi, trattamenti, segni vitali e valori di laboratorio5.

Negli ultimi dieci anni sono stati proposti numerosi metodi assistiti dal machine learning per assistere il processo decisionale medico attraverso la previsione degli eventi postoperatori. Ad esempio, per la chirurgia per la perdita di peso, contributi notevoli includono l'applicazione della regressione logistica (LR) e della regressione di Poisson (PR) per stimare il tasso di riammissione6, l'utilizzo di reti neurali (NN) e macchine di potenziamento del gradiente (GBM) per prevedere perdite gastrointestinali e tromboembolismo venoso7,8 e lo sviluppo dell'algoritmo super learner per prevedere il rischio di riammissione a 30 giorni dopo chirurgia bariatrica9,10. Oltre a valutare possibili eventi postoperatori, i metodi ML sono stati ampiamente applicati per identificare anomalie nelle immagini mediche come lesioni precancerose o precancerose11,12,13,14. Gli esempi principali vanno da un approccio di deep learning alla previsione della mortalità per i pazienti con malattia coronarica e insufficienza cardiaca15 fino ai metodi quantitativi di estrazione delle caratteristiche dell'immagine per la prognosi della rivascolarizzazione precoce in pazienti con sospetta malattia coronarica16. Dal punto di vista algoritmico, le reti neurali profonde sono state attraenti per ricercatori e professionisti medici, grazie alla loro capacità di scoprire strutture nascoste in grandi set di dati, portando ad un'alta probabilità di ottenere risultati soddisfacenti in condizioni adeguate17. Tra questi lavori, l'integrazione delle tecniche ML nella ricerca medica, sebbene abbia successo in molti modi, di solito soffre di una bassa efficienza computazionale a causa della struttura eterogenea, ad esempio, a causa della scarsità e dell'irregolarità, e della grande dimensione dei dati clinici18. In generale, la complessità degli algoritmi ML cresce esponenzialmente in termini di tempo e utilizzo della memoria in funzione della dimensione dei dati. Inoltre, per produrre prestazioni migliori, le reti neurali profonde sacrificano ulteriormente la robustezza al rumore e la parsimonia del modello, oltre all’efficienza computazionale19.

0\) is a constant controlling the sparsity of the solution. Moreover, \(\bar{{\textbf{K}}}^{(j)} = \Gamma {\textbf{K}}^{(j)} \Gamma\) and \(\bar{{\textbf{L}}} = \Gamma {\textbf{L}} \Gamma\) are centered Gram matrices with the entries \({\textbf{K}}_{m,n}^{(j)} = k(p_{j,m},p_{j,n})\) and \({\textbf{L}}_{m,n} = l(y_m,y_n)\) defined by using some kernel functions k and l, where \(y_i\) denotes the class label of the \(i^{\textrm{th}}\) patient and \(\Gamma = {\textbf{I}}_N - \frac{1}{N} {\textbf{1}}_N {\textbf{1}}^{\top }_N\) is the centering matrix. Moreover, for memory and computational efficiency, we use Block HSIC Lasso24 in our experiments./p>