PlantRNA-FM, model sztucznej inteligencji, na którym trenowano RNA danych z ponad 1100 roślin, dekoduje wzorce genetyczne, aby rozwijać naukę o roślinach, ulepszać plony i stawić czoła globalnym wyzwaniom związanym z rolnictwem.
W ramach współpracy badawczej opracowano przełomowy model sztucznej inteligencji (AI), zaprojektowany do dekodowania sekwencji i wzorców strukturalnych tworzących genetyczny „język” roślin.
Ten innowacyjny model, nazwany Plant RNA-FM, jest pierwszym tego rodzaju i został opracowany w ramach partnerstwa badaczy roślin z John Innes Center i informatyków z Uniwersytetu w Exeter.
Twórcy twierdzą, że model stanowi inteligentny przełom technologiczny, który może pobudzić odkrycia i innowacje w naukach o roślinach, a potencjalnie także w badaniach nad roślinami. bezkręgowce i bakterie.
RNA, podobnie jak jego lepiej znany krewny chemiczny DNAjest ważną cząsteczką we wszystkich organizmach, odpowiedzialną za przenoszenie informacji genetycznej w swoich sekwencjach i strukturach. W genomie architektura RNA składa się z kombinacji elementów zwanych nukleotydami, które są ułożone we wzory w taki sam sposób, w jaki alfabet łączy się, tworząc słowa i frazy w języku.
Dekodowanie złożonej struktury RNA
Grupa profesora Yiliang Dinga w John Innes Center bada strukturę RNA, jeden z kluczowych języków cząsteczek RNA, w którym RNA może składać się w złożone struktury regulujące wyrafinowane funkcje biologiczne, takie jak wzrost roślin i reakcja na stres.
Aby lepiej zrozumieć złożony język RNA i jego funkcje, grupa profesora Dinga nawiązała współpracę z grupą dr Ke Li na Uniwersytecie w Exeter.
Wspólnie opracowali PlantRNA-FM, model wyszkolony na ogromnym zestawie danych składającym się z 54 miliardów fragmentów informacji RNA, które tworzą alfabet genetyczny 1124 roślin gatunek.
Tworząc PlantRNA-FM, badacze zastosowali metodologię, zgodnie z którą modele AI, takie jak ChatGPT, są szkolone w zakresie rozumienia ludzkiego języka. Modelu sztucznej inteligencji uczono języka roślinnego poprzez badanie informacji RNA z gatunków roślin z całego świata, aby zapewnić kompleksowy obraz działania RNA w królestwie roślin.
Tak jak ChatGPT potrafi rozumieć ludzki język i reagować na niego, PlantRNA-FM nauczył się rozumieć gramatykę i logikę sekwencji i struktur RNA.
Naukowcy wykorzystali już ten model do precyzyjnego przewidywania funkcji RNA i identyfikowania specyficznych funkcjonalnych wzorców strukturalnych RNA w transkryptomach. Ich przewidywania zostały potwierdzone eksperymentami, które potwierdzają, że struktury RNA zidentyfikowane za pomocą PlantRNA-FM wpływają na efektywność translacji informacji genetycznej na białko.
„Chociaż dla ludzkiego oka sekwencje RNA mogą wydawać się przypadkowe, nasz model sztucznej inteligencji nauczył się dekodować ukryte w nich wzorce” – mówi dr Haopeng Yu, badacz ze stażem podoktorskim w grupie profesora Yilianga Dinga w John Innes Centre.
Wspólny wysiłek z przyszłym potencjałem
Tę udaną współpracę wsparli także naukowcy z Northeast Normal University i Chińska Akademia Nauk w Chinach, którzy wnieśli swój wkład w tę pracę.
Profesor Ding powiedział: „Nasz PlantRNA-FM to dopiero początek. Ściśle współpracujemy z grupą dr Li, aby opracować bardziej zaawansowane podejścia do sztucznej inteligencji, aby zrozumieć ukryte języki DNA i RNA w przyrodzie. Ten przełom otwiera nowe możliwości zrozumienia i potencjalnego programowania roślin, co może mieć głębokie implikacje dla ulepszania upraw i projektowania genów nowej generacji opartego na sztucznej inteligencji. Sztuczna inteligencja w coraz większym stopniu pomaga naukowcom zajmującym się roślinami stawiać czoła wyzwaniom, począwszy od wyżywienia globalnej populacji po uprawę roślin, które będą mogły rozwijać się w zmieniającym się klimacie”.
Odniesienie: „An interpretowalny model podstawowy RNA do badania funkcjonalnych motywów RNA w roślinach” autorstwa Haopeng Yu, Heng Yang, Wenqing Sun, Zongyun Yan, Xiaofei Yang, Huakun Zhang, Yiliang Ding i Ke Li, 9 grudnia 2024 r., Inteligencja maszyny natury.
DOI: 10.1038/s42256-024-00946-z
Badanie zostało sfinansowane przez BBSRC.