Nowa technika umożliwia przechowywanie danych w polimerach syntetycznych, umożliwiając bezpośredni dostęp do bitów bez dekodowania pełnej sekwencji, co znacznie zwiększa gęstość i stabilność przechowywania, co wykazano poprzez zakodowanie adresu uniwersyteckiego w formacie ASCII w polimerze.
Zapotrzebowanie na przechowywanie danych rośnie, a wiele rodzajów danych wymaga długoterminowego przechowywania. Polimery syntetyczne stanowią skuteczną alternatywę dla tradycyjnych nośników pamięci, ponieważ mogą przechowywać informacje przy mniejszym zużyciu przestrzeni i energii. Jednak konwencjonalne metody wyszukiwania, takie jak spektrometria mas, ograniczają długość – a tym samym zdolność przechowywania – poszczególnych łańcuchów polimeru. Teraz, jak podano w Angewandte Chemiebadacze opracowali nowe podejście, które pozwala przezwyciężyć to ograniczenie, umożliwiając bezpośredni dostęp do określonych bitów danych bez konieczności odczytywania całego łańcucha.
Zalety przechowywania polimerów DNA
Dane gromadzą się stale i są generowane w wyniku transakcji biznesowych, monitorowania procesów, zapewniania jakości i śledzenia produktów. Archiwizacja tak ogromnej ilości danych przez dziesięciolecia wymaga znacznej przestrzeni i energii. Do długoterminowego przechowywania dużych, rzadko dostępnych zbiorów danych, makrocząsteczki o określonych sekwencjach, takie jak DNA i polimery syntetyczne, stanowią przekonujące rozwiązanie.
Wyzwania techniczne i innowacyjne rozwiązania
Polimery syntetyczne mają przewagę nad DNA: prostą syntezę, większą gęstość przechowywania i stabilność w trudnych warunkach. Ich wadą jest to, że informacja zakodowana w polimerach jest dekodowana metodą spektrometrii mas (MS) lub tandemowego sekwencjonowania mas (MS2).
W przypadku tych metod wielkość cząsteczek musi być ograniczona, co poważnie ogranicza zdolność przechowywania każdego łańcucha polimeru. Ponadto cały łańcuch musi być dekodowany sekwencyjnie, element po bloku — do interesujących fragmentów nie można uzyskać bezpośredniego dostępu.
To jakby przeczytać całą książkę, zamiast otwierać ją na odpowiedniej stronie. Natomiast długie łańcuchy DNA można pociąć na fragmenty o losowej długości, indywidualnie zsekwencjonować, a następnie komputerowo zrekonstruować w pierwotną sekwencję.
Przełom w kodowaniu i odzyskiwaniu danych
Kyoung Taek Kim i jego zespół na Wydziale Chemii Uniwersytetu Narodowego w Seulu (Korea Południowa) opracowali nową metodę, dzięki której bardzo długie łańcuchy polimerów syntetycznych, których masy cząsteczkowe znacznie przekraczają granice analityczne MS i MS2 można skutecznie rozszyfrować.
W ramach demonstracji zespół zakodował adres uczelni w formacie ASCII i przetłumaczył go – wraz z kodem wykrywania błędów (CRC, uznana metoda stosowana do zapewnienia integralności danych) – na kod binarny, składający się z sekwencji jedynek i zer.
Tę 512-bitową sekwencję przechowywano w łańcuchu polimerowym złożonym z dwóch różnych monomerów: mlekowego kwas oznaczający 1 i kwas fenylomlekowy reprezentujący 0. W nieregularnych odstępach zawierały one również kody fragmentacji zawierające kwas migdałowy. Po aktywacji chemicznej łańcuchy pękają w tych miejscach. W ramach demonstracji uzyskali 18 fragmentów o różnej wielkości, które MS mogły indywidualnie odkodować2 sekwencjonowanie.
Specjalnie opracowane oprogramowanie początkowo identyfikowało fragmenty na podstawie ich masy i grup końcowych, jak pokazano w widmach MS. Podczas stwardnienia rozsianego2 wcześniej zmierzone jony molekularne ulegają dalszemu rozkładowi, a fragmenty te również poddano analizie. Fragmenty można sekwencjonować w oparciu o różnicę mas kawałków. Za pomocą kodu wykrywania błędu CRC oprogramowanie zrekonstruowało sekwencję całego łańcucha, pokonując limit długości łańcuchów polimerowych.
Zespołowi udało się także odszyfrować interesujące fragmenty bez sekwencjonowania całego łańcucha polimeru (dostęp swobodny), np. słowo „chemia” w kodzie adresu. Biorąc pod uwagę, że części ich adresu są ułożone w określonej kolejności (wydział, instytucja, miasto, kod pocztowy, kraj) i oddzielone przecinkami, byli w stanie wyizolować lokalizację, w której przechowywano żądane informacje w ramach łańcucha i tylko zsekwencjonowano odpowiednie fragmenty.
Odniesienie: „Sekwencjonowanie 512-merowego kopoliestru umożliwia losowy dostęp do przechowywanych informacji” autorstwa Heejeong Jang, Hyunseon Chu, Hyojoo Noh i Kyoung Taek Kim, 30 sierpnia 2024 r., Wydanie międzynarodowe Angewandte Chemie.
DOI: 10.1002/anie.202415124