Naukowcy z MIT opracowali SPARROW, przełomowy algorytm zaprojektowany w celu usprawnienia procesu odkrywania leków poprzez optymalizację selekcji molekularnej do syntezy w oparciu o przewidywanie kosztów i właściwości.
Struktura, zademonstrowana w trzech studiach przypadków ze świata rzeczywistego, skutecznie integruje szeroki zakres cząsteczek wejściowych i oblicza najbardziej opłacalne plany syntezy, potencjalnie rewolucjonizując odkrywanie leków i inne dziedziny związane z chemią.
Rewolucyjne odkrywanie leków dzięki sztucznej inteligencji
Wykorzystanie sztucznej inteligencji do usprawnienia odkrywania leków eksploduje. Naukowcy wdrażają modele uczenia maszynowego, aby pomóc im zidentyfikować spośród miliardów opcji cząsteczki, które mogą mieć właściwości, których szukają przy opracowywaniu nowych leków.
Należy jednak wziąć pod uwagę tak wiele zmiennych – od ceny materiałów po ryzyko, że coś pójdzie nie tak – że nawet jeśli naukowcy korzystają ze sztucznej inteligencji, rozważenie kosztów syntezy najlepszych kandydatów nie jest łatwym zadaniem.
Niezliczone wyzwania związane z identyfikacją najlepszych i najbardziej opłacalnych cząsteczek do testowania to jeden z powodów, dla których opracowywanie nowych leków zajmuje tak dużo czasu, a także kluczowy czynnik wpływający na wysokie ceny leków na receptę.
Aby pomóc naukowcom w podejmowaniu świadomych kosztów wyborów, badacze z MIT opracowali strukturę algorytmiczną do automatycznego identyfikowania optymalnych kandydatów molekularnych, co minimalizuje koszty syntezy, jednocześnie maksymalizując prawdopodobieństwo, że kandydaci mają pożądane właściwości. Algorytm identyfikuje również materiały i etapy eksperymentalne potrzebne do syntezy tych cząsteczek.
SPARROW: kompleksowe rozwiązanie
Ich ramy ilościowe, znane jako planowanie syntezy i proces optymalizacji trasy oparty na nagrodach (SPARROW), uwzględniają koszty syntezy partii cząsteczek na raz, ponieważ wielu kandydatów często może pochodzić z niektórych tych samych związków chemicznych.
Co więcej, to ujednolicone podejście pozwala uzyskać kluczowe informacje na temat projektowania molekularnego, przewidywania właściwości i planowania syntezy z repozytoriów internetowych i powszechnie używanych narzędzi sztucznej inteligencji.
Oprócz pomocy firmom farmaceutycznym w skuteczniejszym odkrywaniu nowych leków, SPARROW można wykorzystać do takich zastosowań, jak wynalezienie nowych środków chemicznych dla rolnictwa lub odkrycie specjalistycznych materiałów do elektroniki organicznej.
Sztuka i nauka selekcji złożonej
„Wybór związków jest obecnie w dużej mierze sztuką, a czasem bardzo udaną. Ponieważ jednak dysponujemy wszystkimi innymi modelami i narzędziami prognostycznymi, które dostarczają nam informacji o tym, jak cząsteczki mogą działać i jak mogą być syntetyzowane, możemy i powinniśmy wykorzystywać te informacje do podejmowania decyzji, które podejmujemy” – mówi Connor Coley, specjalista ds. 1957 Adiunkt ds. rozwoju kariery na wydziałach inżynierii chemicznej, elektrotechniki i informatyki MIT oraz starszy autor artykułu o SPARROW.
W artykule do Coleya dołącza główna autorka Jenna Fromer SM ’24. Wyniki badania opublikowano 17 czerwca br Przyroda Nauka obliczeniowa.
Równoważenie kosztów i korzyści w syntezie
W pewnym sensie to, czy naukowiec powinien zsyntetyzować i przetestować określoną cząsteczkę, sprowadza się do pytania o koszt syntezy w stosunku do wartości eksperymentu. Jednak określenie kosztu lub wartości samo w sobie jest trudnym problemem.
Na przykład eksperyment może wymagać drogich materiałów lub może wiązać się z wysokim ryzykiem niepowodzenia. Jeśli chodzi o wartość, można rozważyć, jak przydatna byłaby znajomość właściwości tej cząsteczki lub czy przewidywania te są obarczone wysokim poziomem niepewności.
Jednocześnie firmy farmaceutyczne coraz częściej stosują syntezę wsadową w celu poprawy wydajności. Zamiast testować cząsteczki pojedynczo, używają kombinacji chemicznych elementów składowych, aby testować wielu kandydatów jednocześnie. Oznacza to jednak, że wszystkie reakcje chemiczne muszą wymagać tych samych warunków eksperymentalnych. To sprawia, że oszacowanie kosztów i wartości jest jeszcze większym wyzwaniem.
Zaawansowane techniki optymalizacji
SPARROW stawia czoła temu wyzwaniu, analizując wspólne związki pośrednie biorące udział w syntezie cząsteczek i włączając te informacje do funkcji kosztu w stosunku do wartości.
„Kiedy pomyślisz o tej grze optymalizacyjnej polegającej na projektowaniu partii cząsteczek, koszt dodania nowej struktury zależy od cząsteczek, które już wybrałeś” – mówi Coley.
Ramy uwzględniają również takie czynniki, jak koszty materiałów wyjściowych, liczba reakcji zachodzących na każdej drodze syntezy oraz prawdopodobieństwo, że reakcje te zakończą się sukcesem przy pierwszej próbie.
Udoskonalanie projektu molekularnego poprzez SPARROW
Aby wykorzystać SPARROW, naukowiec dostarcza zestaw związków molekularnych, które zamierza przetestować, oraz definicję właściwości, które mają nadzieję odkryć.
Na tej podstawie SPARROW zbiera informacje na temat cząsteczek i ich szlaków syntezy, a następnie porównuje wartość każdego z nich z kosztem syntezy partii kandydatów. Automatycznie wybiera najlepszy podzbiór kandydatów spełniających kryteria użytkownika i znajduje najbardziej opłacalne drogi syntezy tych związków.
„Całą optymalizację wykonuje w jednym kroku, dzięki czemu może naprawdę uwzględnić wszystkie konkurencyjne cele jednocześnie” – mówi Fromer.
Wszechstronność i zastosowanie SPARROW
SPARROW jest wyjątkowy, ponieważ może zawierać struktury molekularne ręcznie zaprojektowane przez ludzi, te, które istnieją w wirtualnych katalogach lub nigdy wcześniej nie widziane cząsteczki wynalezione za pomocą generatywnych modeli sztucznej inteligencji.
„Mamy różne źródła pomysłów. Częścią atrakcyjności SPARROW jest to, że można wykorzystać wszystkie te pomysły i zastosować je na równych zasadach” – dodaje Coley.
Naukowcy ocenili SPARROW, stosując go w trzech studiach przypadków. Studia przypadków, oparte na rzeczywistych problemach, przed którymi stoją chemicy, miały na celu przetestowanie zdolności projektu SPARROW do znajdowania opłacalnych planów syntezy podczas pracy z szeroką gamą cząsteczek wejściowych.
Odkryli, że SPARROW skutecznie ujął koszty krańcowe syntezy wsadowej i zidentyfikował wspólne etapy eksperymentalne oraz półprodukty chemiczne. Ponadto można go skalować, aby obsłużyć setki potencjalnych kandydatów molekularnych.
„W społeczności zajmującej się uczeniem maszynowym dla chemii istnieje wiele modeli, które dobrze sprawdzają się na przykład w retrosyntezie lub przewidywaniu właściwości molekularnych, ale jak właściwie je wykorzystujemy? Nasze ramy mają na celu wydobycie wartości tej wcześniejszej pracy. Miejmy nadzieję, że tworząc SPARROW, możemy poprowadzić innych badaczy do zastanowienia się nad złożoną selekcją w dół przy użyciu ich własnych funkcji kosztu i użyteczności” – mówi Fromer.
Przyszłe kierunki i wpływ
W przyszłości badacze chcą uwzględnić w SPARROW dodatkową złożoność. Chcieliby na przykład umożliwić algorytmowi uwzględnienie faktu, że wartość testowania jednego związku nie zawsze jest stała. Chcą także uwzględnić więcej elementów chemii równoległej w funkcji kosztu względem wartości.
„Praca Fromera i Coleya lepiej dostosowuje algorytmiczne podejmowanie decyzji do praktycznych realiów syntezy chemicznej. W przypadku stosowania istniejących algorytmów projektowania obliczeniowego określenie najlepszej syntezy zestawu projektów pozostawia się chemikowi medycznemu, co skutkuje mniej optymalnymi wyborami i dodatkową pracą dla chemika medycznego” – mówi Patrick Riley, starszy wiceprezes ds. sztuczna inteligencja w Relay Therapeutics, który nie był zaangażowany w te badania. „W tym artykule przedstawiono opartą na zasadach ścieżkę obejmującą uwzględnienie syntezy łącznej, która, jak mam nadzieję, zaowocuje wyższą jakością i bardziej akceptowanymi projektami algorytmicznymi”.
„Identyfikacja, które związki należy zsyntetyzować w sposób zapewniający staranne zbilansowanie czasu, kosztów i potencjału osiągnięcia postępów w osiąganiu celów, przy jednoczesnym dostarczaniu nowych, przydatnych informacji, jest jednym z najtrudniejszych zadań stojących przed zespołami odkrywającymi leki. Podejście SPARROW opracowane przez Fromera i Coleya robi to w skuteczny i zautomatyzowany sposób, zapewniając przydatne narzędzie zespołom zajmującym się chemią leków u ludzi i podejmując ważne kroki w kierunku w pełni autonomicznego podejścia do odkrywania leków” – dodaje John Chodera, chemik obliczeniowy w Memorial Sloan Kettering Cancer Center, który nie był zaangażowany w tę pracę.
Odniesienie: „An algorytmiczne ramy dla syntetycznego podejmowania decyzji ze świadomością kosztów w projektowaniu molekularnym” Jenny C. Fromer i Connora W. Coleya, 17 czerwca 2024 r., Przyroda Nauka obliczeniowa.
DOI: 10.1038/s43588-024-00639-y
Badania te były częściowo wspierane przez DARPA Program Przyspieszonego Odkrycia Molekularnego, Biuro Badań Marynarki Wojennej i Narodowa Fundacja Nauki.