Naukowcy opracowali przełomową metodę odkrywania, w jaki sposób „myślą” głębokie sieci neuronowe, co ostatecznie rzuca światło na proces podejmowania przez nie decyzji.
Wizualizacja sposobu, w jaki sztuczna inteligencja organizuje dane w kategorie, metoda ta zapewnia bezpieczniejszą i bardziej niezawodną sztuczną inteligencję w rzeczywistych zastosowaniach, takich jak opieka zdrowotna i samochody autonomiczne, co przybliża nas o krok bliżej do prawdziwego zrozumienia sztuczna inteligencja.
Zrozumienie warstw przetwarzania AI
Głębokie sieci neuronowe to rodzaj sztucznej inteligencji (AI) zaprojektowanej w celu naśladowania sposobu, w jaki ludzki mózg przetwarza informacje. Jednak zrozumienie sposobu, w jaki te sieci podejmują decyzje, od dawna stanowiło trudne wyzwanie. Naukowcy z Uniwersytetu Kyushu opracowali nową metodę pozwalającą lepiej zrozumieć, w jaki sposób głębokie sieci neuronowe interpretują dane i organizują je w kategorie. Ich ustalenia, opublikowane w Transakcje IEEE w sieciach neuronowych i systemach uczenia sięmają na celu ulepszenie sztucznej inteligencji dokładnośćniezawodność i bezpieczeństwo.
Podobnie jak ludzie krok po kroku rozwiązują zagadki, głębokie sieci neuronowe przetwarzają informacje poprzez wiele warstw. Pierwsza warstwa, zwana warstwą wejściową, gromadzi surowe dane. Kolejne warstwy, zwane warstwami ukrytymi, analizują dane etapami. Wczesne ukryte warstwy wykrywają proste cechy, takie jak krawędzie lub tekstury – podobnie do identyfikowania poszczególnych elementów układanki. Głębsze warstwy łączą te funkcje, aby rozpoznać bardziej złożone wzorce, takie jak rozróżnienie kota od psa, podobnie jak układanie puzzli w pełny obraz.
Przejrzystość w podejmowaniu decyzji przez sztuczną inteligencję
„Jednak te ukryte warstwy przypominają zamkniętą czarną skrzynkę: widzimy dane wejściowe i wyjściowe, ale to, co dzieje się w środku, nie jest jasne” – mówi Danilo Vasconcellos Vargas, profesor nadzwyczajny na Wydziale Informatyki i Inżynierii Elektrycznej Uniwersytetu Kiusiu. „Ten brak przejrzystości staje się poważnym problemem, gdy sztuczna inteligencja popełnia błędy, czasami spowodowane czymś tak drobnym, jak zmiana pojedynczego piksela. Sztuczna inteligencja może wydawać się mądra, ale zrozumienie sposobu podejmowania decyzji jest kluczem do zapewnienia jej wiarygodności”.
Ograniczenia obecnych metod wizualizacji
Obecnie metody wizualizacji sposobu, w jaki sztuczna inteligencja organizuje informacje, polegają na upraszczaniu danych wielowymiarowych do reprezentacji 2D lub 3D. Metody te pozwalają badaczom obserwować, jak sztuczna inteligencja kategoryzuje punkty danych, na przykład grupując zdjęcia kotów blisko innych kotów, oddzielając je od psów. Jednak to uproszczenie wiąże się z krytycznymi ograniczeniami.
„Kiedy upraszczamy informacje wielowymiarowe do mniejszej liczby wymiarów, przypomina to spłaszczanie obiektu 3D do 2D — tracimy ważne szczegóły i nie widzimy całego obrazu. Ponadto ta metoda wizualizacji sposobu grupowania danych utrudnia porównywanie różnych sieci neuronowych lub klas danych” – wyjaśnia Vargas.
Przedstawiamy metodę rozkładu k*
W tym badaniu naukowcy opracowali nową metodę, zwaną metodą dystrybucji k*, która wyraźniej wizualizuje i ocenia, jak dobrze głębokie sieci neuronowe kategoryzują razem powiązane elementy.
Model działa poprzez przypisanie każdemu wprowadzonemu punktowi danych „wartości k*”, która wskazuje odległość do najbliższego niepowiązanego punktu danych. Wysoka wartość k* oznacza, że punkt danych jest dobrze oddzielony (np. kot z dala od jakichkolwiek psów), natomiast niska wartość k* sugeruje potencjalne nakładanie się (np. pies bliżej kota niż inne koty). Patrząc na wszystkie punkty danych w klasie, takie jak koty, podejście to generuje rozkład wartości k*, który zapewnia szczegółowy obraz organizacji danych.
„Nasza metoda zachowuje przestrzeń o wyższych wymiarach, więc żadna informacja nie zostaje utracona. To pierwszy i jedyny model, który może zapewnić dokładny obraz „lokalnego sąsiedztwa” wokół każdego punktu danych” – podkreśla Vargas.
Wpływ i zastosowania nowej metody
Korzystając ze swojej metody, naukowcy odkryli, że głębokie sieci neuronowe sortują dane w układy skupione, połamane lub nakładające się. W układzie klastrowym podobne przedmioty (np. koty) są zgrupowane blisko siebie, podczas gdy niepowiązane elementy (np. psy) są wyraźnie oddzielone, co oznacza, że sztuczna inteligencja jest w stanie dobrze sortować dane. Jednakże układy połamane wskazują, że podobne elementy są rozproszone na dużej przestrzeni, podczas gdy rozkłady nakładające się mają miejsce, gdy niepowiązane elementy znajdują się w tej samej przestrzeni, przy czym oba układy zwiększają prawdopodobieństwo błędów klasyfikacji.
Vargas porównuje to do systemu magazynowego: „W dobrze zorganizowanym magazynie podobne produkty są przechowywane razem, dzięki czemu ich wyszukiwanie jest łatwe i wydajne. Jeśli elementy są wymieszane, trudniej je znaleźć, co zwiększa ryzyko wybrania niewłaściwego przedmiotu.
Sztuczna inteligencja w systemach krytycznych i przyszłość
Sztuczna inteligencja jest coraz częściej stosowana w krytycznych systemach, takich jak pojazdy autonomiczne i diagnostyka medyczna, gdzie niezbędna jest dokładność i niezawodność. Metoda dystrybucji k* pomaga badaczom, a nawet prawodawcom, ocenić, w jaki sposób sztuczna inteligencja organizuje i klasyfikuje informacje, wskazując potencjalne słabe punkty lub błędy. To nie tylko wspiera procesy legalizacji niezbędne do bezpiecznego zintegrowania sztucznej inteligencji z codziennym życiem, ale także zapewnia cenny wgląd w to, jak sztuczna inteligencja „myśli”. Identyfikując pierwotne przyczyny błędów, badacze mogą udoskonalić systemy sztucznej inteligencji, aby były nie tylko dokładne, ale także solidne – zdolne do obsługi niejasnych lub niekompletnych danych i dostosowywania się do nieoczekiwanych warunków.
„Naszym ostatecznym celem jest stworzenie systemów sztucznej inteligencji, które zachowują precyzję i niezawodność, nawet w obliczu wyzwań związanych ze scenariuszami w świecie rzeczywistym” – podsumowuje Vargas.
Odniesienie: „K* Distribution: Evaluating the Latent Space of Deep Neural Networks Using Local Neighborhood Analysis”, Shashank Kotyan, Tatsuya Ueda i Danilo Vasconcellos Vargas, 16 września 2024 r., Transakcje IEEE w sieciach neuronowych i systemach uczenia się.
DOI: 10.1109/TNNLS.2024.3446509