Dal MIT un nuovo modello di docking molecolare

(credit: autori dello studio)

DiffDock è un modello di docking molecolare ideato da ricercatori dell’Abdul Latif Jameel Clinic for Machine Learning in Health del Massachusetts Institute of Technolgy di Cambridge con l’intento di modificare il paradigma con cui si fa ricerca farmacologica.

Gli ideatori di questo modello vogliono facilitare l’individuazione di molecole attive contro una certa proteina, velocizzando il processo di ricerca e riducendone i costi.
Non è un segreto che lo sviluppo di un nuovo farmaco può richiedere anni e svariati test preclinici e clinici, non sempre di successo… anche quando ci si affida a strumenti di docking molecolare, che studiano in silico le possibili interazioni tra il candidato farmaco e la proteina di riferimento.

Gli strumenti di docking oggi più utilizzati utilizzano un approccio “sampling and scoring”: cercano la posizione migliore con cui il ligando può agganciare la tasca proteica. Occorre quindi valutare un gran numero di posizioni, per poi valutare quale sia la migliore. Ci vuole tempo.

Come spiega Gabriele Corso, coautore dello studio, «con il metodo tradizionale si parte dal presupposto che vi sia un solo target possibile e che si debba ottimizzare l’unica risposta possibile». Invece, con i modelli generativi si assume che vi siano più risposte possibili al problema. In sostanza, DiffDock si individuano una serie di possibilità, dando a ognuna una diversa probabilità.

Come funziona il sistema? Il modello è stato allenato con una serie di possibili forme di siti di legame, sia per i ligandi che per le proteine, e ora può con facilità identificare i possibili siti di legame di una proteina mai incontrata prima, fornendo per ognuno delle precise coordinate 3D che aiutano a trovare gli angoli potenzialmente utili per il legame del farmaco.

Qui entra in gioco una nuova tecnologia di intelligenza artificiale, AlphaFold 2, un famoso modello di intelligenza artificiale per il ripiegamento delle proteine.
DiffDock ha dimostrato di avere una accuratezza superiore agli approcci già esistenti, avendo successo anche in presenza di proteine flessibili.

Per fare un esempio, considerando una situazione computazionale, il modello è in grado di posizionare il 22% delle proprie previsioni entro 2 angstroms di distanza dal sito di legame… laddove altri modelli arrivano al 10% circa.
Ciò fornisce maggiori possibilità alla ricerca. DiffDock può anche essere utilizzato, in sinergia con tecniche di ripiegamento delle proteine, per effettuare il reverse screening in silico, ovvero capire quali sono le proteine interessate da un farmaco che si è dimostrato efficace contro una data patologia, in modo più economico e veloce.
Un altro ambito in cui il modello potrebbe portare giovamenti è quello degli effetti collaterali. Il modello verrà presentato a maggio presso la “11th International Conference on Learning Representations” (https://iclr.cc/).