Nelle profondità del genoma

Quando gli algoritmi analizzano il materiale genetico completo di un tumore, possono ottimizzare il successo della terapia. L'analisi aiuta anche a scoprire come si sviluppa il cancro.

Illustrazione Intelligenza artificiale
(Illustrazione: Ray Oranges)

In alcune delle più importanti cliniche del mondo specializzate nel trattamento del cancro, questa è già una pratica standard: i campioni di tessuto dei tumori di ogni paziente vengono esaminati geneticamente in modo molto dettagliato. Gli esperti estraggono il DNA dai campioni e lo utilizzano per decodificare l'intero patrimonio genetico del tumore canceroso. Insieme alle informazioni sull'attività dei singoli geni, questo aiuta a descrivere con maggiore precisione il tipo di tumore e a prevedere a quali terapie e farmaci un paziente ha maggiori probabilità di rispondere.

Decodificare il genoma completo di un tumore, tuttavia, significa avere a che fare con diverse centinaia di gigabyte di dati grezzi che devono prima essere analizzati. Questo è possibile solo grazie a efficienti algoritmi di apprendimento automatico, come spiega Niko Beerenwinkel. È professore di Biologia computazionale presso il Dipartimento biosistemi ed è specializzato nell'analisi dei dati biologici molecolari.

I moderni dispositivi di sequenziamento del DNA sono potenti e veloci. Tuttavia, i dispositivi forniscono dati grezzi "rumorosi" che possono essere interpretati solo con potenti analisi al computer. "Gli algoritmi riducono il rumore confrontando i dati grezzi di un'analisi del genoma con un gran numero di altre analisi del genoma e decidendo così cosa è più probabile che sia rumore e cosa no", spiega Beerenwinkel.

Trovare l'ago nel pagliaio

Tuttavia, l'analisi è tutt'altro che conclusa. "Il materiale genetico di un tumore contiene spesso migliaia di piccole modifiche, di cui solo alcune sono rilevanti", spiega Beerenwinkel. "Ci sono anche cambiamenti che da soli sono insignificanti dal punto di vista medico, ma che sono cruciali in combinazione con altri cambiamenti". Anche gli algoritmi informatici aiutano a estrarre informazioni rilevanti dal punto di vista medico dalle grandi quantità di dati.

Inoltre, i tumori sono ammassi di diversi tipi di cellule che differiscono notevolmente in termini di genetica e funzione. Oltre alle cellule tumorali vere e proprie, i tumori contengono anche cellule dei vasi sanguigni e del sistema immunitario, ad esempio. Poiché il materiale genetico delle cellule tumorali cambia rapidamente, in un tumore sono presenti diverse popolazioni geneticamente diverse di queste cellule degenerate, che potrebbero non reagire tutte allo stesso farmaco.

Beerenwinkel e il suo gruppo stanno sviluppando metodi di apprendimento automatico e software per riconoscere e descrivere la grande diversità genetica dei tumori. "In futuro, sarà possibile prendere in considerazione tutte le popolazioni cellulari nel trattamento del cancro e non solo quella più comune, come avviene di solito oggi", afferma Beerenwinkel.

Prognosi e terapie

Anche Valentina Boeva, professoressa di Informatica biomedica presso il Dipartimento di Informatica dell'ETH di Zurigo, utilizza algoritmi di apprendimento automatico. Uno degli obiettivi della sua ricerca sono i cambiamenti epigenetici nelle cellule tumorali. Si tratta di modifiche temporanee e reversibili del materiale genetico, in contrapposizione alle modifiche genetiche permanenti.

"Come risultato dei cambiamenti epigenetici, nelle cellule tumorali sono attivi geni diversi rispetto alle cellule sane originarie e vengono prodotte proteine diverse", spiega Boeva. La ricercatrice utilizza database con dati anonimi di pazienti messi a disposizione delle ricerche e li valuta con algoritmi informatici.

In un lavoro di ricerca non ancora pubblicato, è riuscita a dimostrare perché i cambiamenti epigenetici in alcuni tumori sono associati a una maggiore aggressività: Grazie a questi cambiamenti, i tumori riescono a eludere le difese immunitarie dell'organismo. Poiché i cambiamenti possono essere invertiti con i farmaci, i risultati forniscono indicazioni su nuove opzioni terapeutiche.

Un altro esempio è la ricerca di sezioni del genoma che regolano l'attività dei geni. Le mutazioni in queste sezioni sono importanti anche per lo sviluppo del cancro. Queste sezioni sono spesso situate vicino al gene che regolano. Tuttavia, se sono più lontane, sono difficili da trovare. "Un'altra sfida è scoprire quale gene regola tale sezione", spiega Boeva. Ha utilizzato un moderno metodo di apprendimento automatico sviluppato nella linguistica computazionale per catturare il significato di un testo. Boeva lo ha utilizzato per analizzare i dati del genoma al fine di determinare il "significato" delle singole sezioni del genoma. In questo modo ha trovato sequenze di genomi regolatori precedentemente sconosciuti.

Per il suo lavoro Boeva non ha sempre bisogno di metodi di analisi all'avanguardia. "A volte raggiungo il mio obiettivo utilizzando metodi statistici sviluppati da scienziati diversi decenni fa", dice. Il numero di metodi è elevato e spesso non sa fin dall'inizio quale sia il metodo più adatto a risolvere un problema. Si tratta di provarne diversi. "Tuttavia, l'apprendimento automatico continuerà a svilupparsi", afferma l'ETH. E in futuro, probabilmente, ci saranno algoritmi che selezioneranno automaticamente il metodo di apprendimento automatico migliore.

Adatti al mercato del lavoro

Gli studenti sono molto interessati all'apprendimento automatico. Anche l'industria farmaceutica ha riconosciuto l'apprendimento automatico e l'intelligenza artificiale come tecnologie chiave. Oltre al campo dei biomarcatori molecolari, in cui Beerenwinkel e Boeva lavorano, essi sono utilizzati anche nello sviluppo di nuove molecole di farmaci. "Sto riscontrando un grande interesse da parte dell'industria, sia per collaborare con noi su progetti di ricerca che per assumere i nostri laureati", afferma Beerenwinkel.

Se l'ETH Boeva troverà nuovi segmenti di genoma rilevanti per il cancro, non ne beneficeranno solo i pazienti delle migliori cliniche. Infatti, sempre più spesso vengono effettuate analisi genetiche limitate su pazienti affetti da cancro in ospedali meno specializzati. Invece dell'intero genoma, vengono analizzate solo alcune decine di sezioni del genoma. Sono queste le sezioni e le mutazioni che Boeva, Beerenwinkel e molti altri ricercatori in tutto il mondo hanno scoperto con l'aiuto del machine learning e di cui hanno decodificato la funzione.

Questo testo è pubblicato nell'attuale numero dell'ETH Magazine. Globo pubblicato.

JavaScript è stato disabilitato sul tuo browser