Article 2 maggio 2022

Validazione dati del mondo reale (RW): arriva ARGO per l’onco-ematologia

Le potenzialità delle nuove terapie implementate nella cura delle neoplasie ematologiche vengono costantemente confermate da ampi studi ampi controllati, ma a ciò, purtroppo, non si affianca una necessaria validazione dei Real World Data. Quest’ultimi, ossia “i dati raccolti dal mondo reale”, assumono un’importanza sempre più rilevante per i clinici, poiché consentono di descrivere un quadro che corrisponde maggiormente alla realtà osservata tutti i giorni nella pratica clinica. A tal proposito, un gruppo di ricercatori dell’IRCCS Istituto Tumori Giovanni Paolo II di Bari ha sviluppato ARGO, una nuova tecnologia di intelligenza artificiale che, soddisfacendo i criteri standard, sembra rappresentare un ottimo sistema da utilizzare nella pratica clinica quotidiana in onco-ematologia

I Real World Data, ossia “i dati raccolti dal mondo reale”, stanno assumendo un’importanza sempre più rilevante per i clinici e i decisori della spesa pubblica, poiché aggiungono informazioni agli studi clinici controllati, consentendo, in tal modo, di descrivere un quadro che corrisponde maggiormente alla realtà osservata nella pratica clinica inerente a popolazioni eterogenee.

Negli ultimi anni, la complessità dei dati clinici e biologici necessari per una corretta diagnosi e prognosi delle malattie onco-ematologiche, soprattutto nell’ambito dei linfomi, è notevolmente aumentata.
Se da un lato si assiste ad una continua conferma della potenzialità delle nuove terapie implementate nella cura delle neoplasie ematologiche, grazie al supporto di ampi studi controllati, dall’altro si riscontra una diffusa mancanza di validazione di questi Real World Data.

A causa di questa discordanza, sembra che sia chiara l’urgenza di un miglioramento del sistema di raccolta e di condivisione dei Real World Data, al fine di supportare la ricerca traslazionale.
Spesso, i dati raccolti dal mondo reale derivano da fonti frammentate, come registri medici, registri elettronici, database individuali, dispositivi mobili che possono fornire informazioni sullo stato di salute del paziente.
A ciò si affianca la mancanza di professionisti specializzati nell’immissione dei dati, così come un accesso ai sistemi di estrazione dei dati alquanto problematico per la maggior parte dei medici.
Da qui, nasce la necessità di creare strumenti che facilitino il processo di registrazione, di accesso e di utilizzo dei dati sanitari.

A tal proposito, un gruppo di ricercatori dell’IRCCS Istituto Tumori Giovanni Paolo II di Bari ha sviluppato un nuovo strumento ad alta tecnologia. Si chiama ARGO (Automatic Record Generator for Onco-hematology) ed è stato creato sulla base di due note tecnologie: NLP e OCR.
Il Natural Language Processing (NLP) è un tipo di intelligenza artificiale ed è una tecnica utilizzata per estrarre informazioni significative da porzioni di testo (es. referti), ampiamente adottata anche in onco-ematologia.
L’Optical Character Recognition (OCR) è una tecnologia all’avanguardia che converte i report cartacei in formati digitali. Rappresenta l’anello di congiunzione tra la NLP e le eCRF (Electronic Case Report Form), ossia schede di raccolta dati elettroniche che si utilizzano per la raccolta di dati di studi clinici, contenuti nel REDCap (Research Electronic Data CAPture), ossia un programma di “cattura di dati elettronica”, particolarmente utile nella ricerca per una raccolta dati rapida e strutturata.

ARGO, quindi, è in grado di convertire automaticamente i Real World Data di report istopatologici non strutturati in eCRF standardizzate per la raccolta dei dati. Ogni rapporto cartaceo viene convertito manualmente in un file immagine da un comune scanner digitale, che viene caricato in ARGO attraverso un’interfaccia web, la quale trasforma il file immagine in testo strutturato tramite OCR e salvato, sotto forma di dati strutturati, in un database, tramite server web.

In questo modo viene fatta la diagnosi e, allo stesso tempo, i dati vengono raccolti in eCRF.

Le tecniche di NLP, infatti, sono state adottate in ARGO per consentire l’estrazione automatica di termini rilevanti per la diagnosi della malattia che vengono trasferiti, poi, nelle eCRF digitalizzate. Pertanto, vengono estratte tutte le informazioni riguardanti la diagnosi, la data del referto, l’ID del referto, il tipo di campione e tutta una serie dati quantitativi e qualitativi che verranno salvati nel database e che verranno sfruttati per fare le diagnosi. Oltre alla standardizzazione dei dati raccolti, ARGO è in grado di integrare e di elaborare dati sia da un database interno che esterno e, inoltre, presenta un alto grado di precisione e accuratezza.

La generalizzabilità di ARGO è stata valutata su una coorte multicentrica di 326 casi di linfoma, tra cui il linfoma diffuso a grandi cellule B, il linfoma follicolare ed il linfoma mantellare, provenienti da sette centri indipendenti. Il nuovo sistema informatico ha dimostrato di riconoscere qualsiasi modello di input, a prescindere dalle caratteristiche cliniche raccolte nel referto, e di rilevare la terminologia specifica, clinicamente rilevante, per la definizione di ogni tipo di diagnosi.

La nuova tecnologia ARGO, presentata e descritta in un recente studio pubblicato su Scientific Reports, appare come un valido strumento di registrazione dei dati clinici, preciso e rapido rispetto all’astrazione manuale. Facilitando la consultazione, il filtraggio e la gestione dei Real World Data, consente di studiare ampie percentuali di pazienti onco-ematologici che non hanno accesso alle sperimentazioni cliniche e di supportare la rete di ricerca nazionale. I limiti principali, rappresentati dal linguaggio dei referti istopatologici, possono essere tuttavia superati mediante software di traduzione.

Dal momento che ARGO soddisfa i criteri standard, è adattabile ad ogni ambito clinico e rappresenta, dunque, un ottimo sistema di validazione dei dati.

Commenti


Empty

Lascia un commento: