Strona główna nauka/tech Doładowanie odkrycia naukowego dzięki modelom FAIR AI

Doładowanie odkrycia naukowego dzięki modelom FAIR AI

16
0


Piki dyfrakcji Bragga w nieodkształconej próbce bikrystalicznego złota
Wizualizacja pików dyfrakcji Bragga w nieodkształconej próbce bikrystalicznego złota. Wysokość oznacza liczbę fotonów. Dane te wygenerowano w Advanced Photon Source i przetworzono w superkomputerze ThetaGPU przy użyciu modeli sztucznej inteligencji. Źródło: Argonne Leadership Group ds. wizualizacji obiektów obliczeniowych i analizy danych

Dostosowanie zasad FAIR do modeli sztucznej inteligencji zmieniło badania naukowe, umożliwiając szybsze i bardziej wiarygodne wyniki.

Integrując sztuczną inteligencję ze zbiorami danych, badacze z Argonne National Laboratory radykalnie przyspieszyli analizę materiałów, torując drogę zaawansowanym przełomom naukowym opartym na sztucznej inteligencji.

FAIR Zasady dotyczące sztucznej inteligencji

Badacze początkowo zaproponowali zasady FAIR – możliwość znalezienia, dostępność, interoperacyjność i możliwość ponownego wykorzystania – aby zdefiniować najlepsze praktyki maksymalizujące wykorzystanie zbiorów danych zarówno przez badaczy, jak i maszyny. Zasady te zostały obecnie dostosowane do naukowych zbiorów danych i oprogramowania badawczego, mając na celu zwiększenie przejrzystości, odtwarzalności i możliwości ponownego wykorzystania badań, a także promowanie ponownego wykorzystania oprogramowania zamiast jego przebudowy.

Modele sztucznej inteligencji (AI), które integrują różne zasoby cyfrowe, takie jak zbiory danych, oprogramowanie badawcze i zaawansowane obliczenia, teraz również są zgodne z tymi zasadami. W nowym artykule przedstawiono zestaw praktycznych, zwięzłych i mierzalnych zasad FAIR specjalnie dostosowanych do modeli sztucznej inteligencji. Zawiera dalsze szczegóły, w jaki sposób połączenie modeli FAIR AI ze zbiorami danych może znacznie przyspieszyć odkrycia naukowe.

Postęp w odkryciach naukowych dzięki FAIR AI

Niniejsza praca wprowadza precyzyjną definicję zasad FAIR dla modeli AI oraz ilustruje ich zastosowanie w specjalnym rodzaju zaawansowanej mikroskopii. W szczególności demonstruje integrację zbiorów danych FAIR i modeli sztucznej inteligencji w celu scharakteryzowania materiałów w zaawansowanym źródle fotonów Argonne National Laboratory (ANL), uzyskując wyniki o dwa rzędy wielkości szybciej niż tradycyjnymi metodami.

Badanie podkreśla również, jak połączenie zaawansowanego źródła fotonów ANL z ośrodkiem obliczeniowym Argonne Leadership Computing Facility może jeszcze bardziej zwiększyć szybkość odkryć naukowych. Metodologia ta eliminuje rozbieżności sprzętowe, ułatwia badaczom ujednolicenie języka sztucznej inteligencji i wspomaga odkrycia oparte na sztucznej inteligencji. Wdrożenie niniejszych wytycznych FAIR dotyczących modeli sztucznej inteligencji ma napędzać rozwój technologii sztucznej inteligencji nowej generacji i wspierać nowe połączenia między danymi, modelami sztucznej inteligencji i obliczeniami o wysokiej wydajności.

Modele danych i sztucznej inteligencji FAIR w działaniu

W ramach tych badań naukowcy stworzyli eksperymentalny zestaw danych FAIR obejmujący piki dyfrakcyjne Bragga nieodkształconej próbki bikrystalicznego złota wyprodukowanej w Advanced Photon Source w Argonne National Laboratory. Ten zbiór danych gotowy na FAIR i sztuczną inteligencję został opublikowany w Materials Data Facility.

Następnie badacze wykorzystali ten zbiór danych do szkolenia trzech typów modeli sztucznej inteligencji w Argonne Leadership Computing Facility (ALCF): tradycyjnego modelu sztucznej inteligencji wykorzystującego API PyTorch o otwartym kodzie źródłowym; wersja NVIDIA TensorRT tradycyjnego modelu AI PyTorch wykorzystująca superkomputer ThetaGPU; oraz model wyszkolony na SambaNova DataScale systemu na stanowisku testowym ALCF AI. Te modele sztucznej inteligencji obejmują wskaźniki kwantyfikacji niepewności, które wyraźnie wskazują, kiedy przewidywania sztucznej inteligencji są godne zaufania.

Wdrażanie i weryfikacja modeli FAIR AI

Te trzy różne modele zostały następnie opublikowane w Data and Learning Hub for Science zgodnie z zaproponowanymi przez badaczy zasadami FAIR dotyczącymi modeli sztucznej inteligencji. Następnie połączyli wszystkie te różne zasoby, modele FAIR AI i zbiory danych, a następnie wykorzystali superkomputer ThetaGPU w ALCF do przeprowadzenia powtarzalnych wnioskowań opartych na sztucznej inteligencji.

Cały ten przepływ pracy jest koordynowany za pomocą Globus i wykonywany za pomocą Globus Compute. Naukowcy opracowali oprogramowanie umożliwiające automatyzację tej pracy i poprosili kolegów z Uniwersytetu Illinois o niezależną weryfikację powtarzalności wyników.

Odniesienie: „Zasady FAIR dla modeli AI z praktycznym zastosowaniem przyspieszonej mikroskopii dyfrakcyjnej wysokoenergetycznej” autorstwa Nikila Raviego, Pranshu Chaturvedi, EA Huerta, Zhengchun Liu, Ryan Chard, Aristana Scourtas, KJ Schmidt, Kyle Chard, Ben Blaiszik i Ian Foster, 10 listopada 2022 r., Dane naukowe.
DOI: 10.1038/s41597-022-01712-9

Prace te były wspierane przez program FAIR Data i projekt Braid Biura Naukowego Departamentu Energii (DOE), Advanced Scientific Computing Research. Wykorzystano zasoby Argonne Leadership Computing Facility, obiektu użytkownika Departamentu Nauki DOE. Projekt uzyskał także wsparcie Departamentu Handlu, Narodowego Instytutu Standardów i Technologii, Narodowej Fundacji Nauki, programu badań i rozwoju laboratorium Argonne National Laboratory oraz zasobów Advanced Photon Source, obiektu użytkownika DOE Office of Science w Argonne National Laboratorium.



Link źródłowy